全球AI动态精选(2026年2月4日)
今日AI领域呈现出多维度创新态势,从轻量化模型到多模态应用,从开源生态到商业化落地,各大科技巨头与新兴企业竞相突破。支付宝首次上线AI眼镜扫福功能标志着AI硬件与日常支付场景的深度融合;昆仑万维与智谱分别发布轻量级模型,推动AI技术普惠化;OpenAI、谷歌等巨头持续迭代核心产品,而马斯克旗下xAI的收购与新产品发布则进一步加剧了行业竞争格局。整体来看,AI技术正加速从云端走向终端,从通用能力向垂直场景渗透,商业化进程显著提速。
支付宝上线AI眼镜扫福功能
支付宝于2月4日正式宣布推出AI眼镜扫福功能,用户可通过佩戴AI眼镜直接扫描福字获取红包奖励。这一功能将计算机视觉技术与传统春节习俗相结合,实现了AR增强现实与移动支付的深度融合。支付宝团队表示,该功能已在部分城市试点,并计划在春节前全面推广。
这一创新标志着AI硬件与传统互联网应用的跨界融合进入新阶段。随着AI眼镜等可穿戴设备的普及,未来可能出现更多基于场景的AI应用,推动AR技术与日常生活的无缝衔接。支付宝此举不仅强化了其春节营销活动,也为AI硬件的商业化落地提供了重要参考。
昆仑万维发布天工Skywork桌面版
昆仑万维于2月4日面向全球发布天工Skywork桌面版,这是一款轻量级AI助手应用,支持多模态交互与本地化部署。该产品采用混合计算架构,可根据网络状况智能选择云端或本地处理,在保持高性能的同时降低了对硬件的要求。
Skywork桌面版的发布反映了AI应用向轻量化、本地化发展的趋势。随着用户对数据隐私的关注度提高,能够实现本地部署的AI产品将获得更多市场青睐。昆仑万维此举不仅丰富了其AI产品矩阵,也为企业级AI应用提供了新的技术路径,预计将推动AI技术在办公场景的进一步普及。
智谱发布0.9B轻量级GLM-OCR模型
智谱AI于2月4日发布0.9B参数规模的GLM-OCR模型,该模型在复杂文档识别任务上实现了性能SOTA(State-of-the-Art)。尽管参数量仅为0.9B,但GLM-OCR在多语言文档、表格识别和版面分析等方面表现出色,大幅降低了部署门槛。
GLM-OCR的推出标志着轻量化AI模型在专业领域取得重要突破。小参数量与大性能的结合,使得AI技术能够在边缘设备和低算力场景中广泛应用,推动OCR技术的普惠化。智谱表示,该模型将在医疗、金融等专业领域率先落地,预计将显著提升行业文档处理效率。
OpenAI推出macOS版Codex应用
OpenAI于2月4日正式推出macOS版的Codex应用,将强大的代码生成能力引入苹果生态系统。该应用支持Xcode、VS Code等主流开发环境,能够提供智能代码补全、错误检测和功能建议,大幅提升开发效率。
macOS版Codex的发布进一步巩固了OpenAI在AI辅助编程领域的领先地位。随着苹果开发者生态的持续扩大,这一产品将影响全球数百万开发者,改变软件开发的工作流程。同时,这也反映了AI工具向垂直专业领域渗透的趋势,未来可能出现更多针对特定行业的AI应用。
阿里千问投入30亿发放红包
阿里巴巴旗下的千问AI于2月4日宣布投入30亿元开展"AI红包雨"活动,用户通过使用千问AI即可获得现金红包奖励。此次活动将持续整个春节假期,旨在扩大千问AI的用户基础,提升产品活跃度。
阿里千问的大规模补贴反映了AI应用获客成本攀升的行业现状。随着AI助手市场竞争加剧,各厂商纷纷通过补贴策略争夺用户。此举不仅将加速AI助手在普通消费者中的普及,也将推动AI应用从专业领域向大众市场延伸,预计将引发行业新一轮的营销竞争。
快手启动AI内容专项整治
快手于2月4日宣布启动"AI清朗行动",针对平台上的AI生成内容进行专项整治。此次行动将重点打击AI换脸、AI配音等技术滥用导致的虚假信息和低俗内容,建立AI内容标识机制,保障用户权益。
快手的整治行动体现了AI内容监管的行业自律趋势。随着AIGC技术的普及,内容真实性面临挑战,平台方需要建立有效的审核机制。快手此举不仅有助于净化平台内容生态,也为行业提供了AI内容治理的参考方案,预计将推动建立更加完善的AI内容监管体系。
宇树科技开源UnifoLM-VLA-0大模型
宇树科技于2月4日开源UnifoLM-VLA-0大模型,这是一款面向视觉-语言-动作多模态任务的基础模型。该模型参数规模为0.7B,在机器人控制、自动驾驶等场景表现出色,支持低资源环境下的高效部署。
宇树科技的开源举措将进一步推动AI技术在机器人领域的应用。多模态大模型的开源将降低机器人研发门槛,促进产业创新。作为机器人领域的领先企业,宇树通过开源生态建设,有望巩固其技术领先地位,并加速AI技术与实体经济的深度融合。
腾讯"元宝派"AI助手内测截图泄露
2月4日,腾讯内部代号为"元宝派"的AI助手产品内测截图在网络泄露。从截图来看,该产品支持多轮对话、任务自动化和跨应用协同,定位为个人智能助理,预计将与腾讯现有的办公、社交等产品线深度整合。
"元宝派"的泄露反映了各大科技巨头在AI助手领域的激烈竞争。腾讯凭借其丰富的应用生态和用户基础,有望打造出功能全面的AI助手产品。该产品的正式推出将进一步加剧AI助手市场竞争,推动行业向更加智能化、个性化的方向发展。
MiniMax发布Music 2.5音乐生成模型
MiniMax于2月4日发布Music 2.5音乐生成模型,该模型在音乐创作质量、风格多样性和生成速度方面均有显著提升。Music 2.5支持多种音乐风格和乐器组合,能够根据文本描述生成专业级音乐作品,已开放给部分创作者试用。
Music 2.5的发布标志着AI音乐创作技术进入新阶段。随着生成式AI在创意领域的应用深化,音乐创作门槛将大幅降低,更多非专业创作者能够借助AI实现音乐梦想。这也将推动音乐产业的生产模式变革,预计将催生更多AI辅助创作的音乐作品和商业模式。
蚂蚁灵波开源LingBot-World世界模型
蚂蚁集团于2月4日开源LingBot-World世界模型,这是一款专注于物理世界模拟的基础模型。该模型能够理解和生成复杂的物理场景,支持机器人训练、自动驾驶仿真等应用,已在蚂蚁集团的多个业务场景中验证。
蚂蚁灵波的开源反映了AI技术在物理世界理解方面的突破。世界模型的开源将加速AI与实体经济的融合,推动智能制造、自动驾驶等领域的发展。作为金融科技领域的领军企业,蚂蚁通过开源技术生态建设,将进一步扩大其在AI领域的影响力,促进产业协同创新。
马斯克宣布SpaceX完成对xAI的收购
埃隆·马斯克于2月4日宣布,SpaceX已完成对旗下AI公司xAI的收购,交易估值达1.25万亿美元。此次收购将整合SpaceX的航天技术与xAI的人工智能能力,共同推动AI在太空探索、深空通信等领域的应用。
SpaceX对xAI的高估值反映了资本市场对AI+航天赛道的看好。这一收购将加速AI技术与航天领域的深度融合,可能催生全新的太空AI应用场景。马斯克通过整合资源,有望打造出全球领先的AI航天技术平台,进一步巩固其在科技领域的领先地位。
腾讯混元图像3.0进入测试阶段
腾讯于2月4日透露,其混元大模型的图像生成版本混元图像3.0已进入内部测试阶段。该模型在图像质量、生成速度和可控性方面均有显著提升,支持高分辨率图像生成和精细控制,预计将在腾讯的社交、内容创作等产品中应用。
混元图像3.0的测试进展表明腾讯在多模态AI领域的持续投入。随着图像生成技术的成熟,AI将在内容创作、广告营销等领域发挥更大作用。腾讯凭借其庞大的用户基础和应用生态,有望将混元图像3.0快速商业化,创造新的商业价值,同时也将推动AI技术在内容创作领域的普及。




