导航首页 » 资源中心 » AI最新资讯 » 2026年2月7日AI前沿情报速递

2026年2月7日AI前沿情报速递

浏览 275559 2026-02-07 06:55:35 点赞 353

2026年2月7日AI前沿情报速递

今日AI行业呈现多维度发展态势，大模型迭代加速，应用场景持续拓展，资本活跃度保持高位。国际巨头与本土创新企业竞相推出新一代产品，开源生态日益繁荣，AI技术在垂直领域的落地速度明显加快。监管与自律并重，行业正朝着更加健康有序的方向发展。

可灵AI发布3.0版本，多模态能力全面升级

可灵AI于今日正式发布3.0版本，新版本在多模态理解与生成能力上实现显著突破，支持更复杂的跨模态任务处理。该版本优化了图像识别准确率，提升了文本与图像融合生成质量，并新增了视频内容理解功能，为用户提供更丰富的交互体验。

此次升级标志着可灵AI在多模态领域的技术成熟度达到新高度，将进一步推动AI在创意设计、内容创作等领域的应用落地。可灵AI团队表示，未来将持续优化模型性能，拓展行业解决方案，计划在3个月内推出针对教育、医疗等垂直领域的定制化版本。

阿里大模型品牌正式更名为"千问"，战略定位更加清晰

阿里巴巴集团今日宣布，旗下大模型品牌正式从"通义千问"更名为"千问"，此举旨在简化品牌架构，强化产品辨识度。新品牌标识更加简洁，同时保留了"千问"这一具有中国文化特色的名称，体现了阿里AI战略的本土化与国际化并重。

品牌更名背后是阿里AI战略的全面升级，未来"千问"将作为阿里AI业务的统一品牌，涵盖大模型、AI应用开发平台及行业解决方案。分析人士认为，这一调整有助于阿里整合内部AI资源，提升市场竞争力，同时为即将推出的30亿元红包活动奠定品牌基础。

Mistral AI推出Voxtral Transcribe 2语音模型，准确率提升40%

法国AI企业Mistral AI今日发布Voxtral Transcribe 2语音模型，该模型在多语言语音识别准确率上较前代提升40%，支持超过100种语言的实时转录。新模型采用先进的声纹识别技术，能够在嘈杂环境中保持高识别率，并支持说话人分离功能。

Voxtral Transcribe 2的发布将进一步推动语音AI在会议记录、客服系统、媒体内容制作等领域的应用。Mistral AI表示，该模型将作为开源版本发布，同时提供企业级定制服务，预计将在全球范围内吸引更多开发者参与语音AI生态建设。

支付宝首次上线AI眼镜扫福功能，开启AR支付新体验

支付宝今日宣布，首次上线AI眼镜扫福功能，用户通过佩戴支持AR功能的智能眼镜，即可扫描实体福字获取数字红包。该功能结合了计算机视觉与增强现实技术，实现了现实世界与数字内容的无缝融合，为春节传统习俗注入科技元素。

此次合作标志着支付宝在AR支付领域的重要突破，将为智能硬件厂商带来新的商业机会。支付宝团队透露，未来将拓展更多基于AR的支付场景，包括虚拟试衣、室内导航等，预计年内将支持超过1000款智能眼镜设备接入该功能。

昆仑万维发布天工Skywork桌面版，AI创作工具生态进一步完善

昆仑万维今日正式发布天工Skywork桌面版，这是一款集文本创作、图像生成、视频剪辑于一体的AI创作工具。桌面版保留了云端版本的核心功能，并针对本地化使用进行了优化，支持离线模式，满足创作者在不同网络环境下的使用需求。

天工Skywork桌面版的推出进一步完善了昆仑万维的AI创作工具生态，为创作者提供更加灵活的工作方式。昆仑万维表示，未来将持续丰富桌面版功能，计划在第二季度加入3D模型生成能力，并推出针对专业创作者的高级版本，进一步巩固其在AI创作领域的技术优势。

OpenAI推出macOS版Codex应用，开发者体验全面升级

OpenAI今日正式发布macOS版的Codex应用，为苹果开发者提供更高效的编程辅助工具。新应用针对macOS系统进行了深度优化，支持Xcode集成，能够提供实时代码补全、错误检测和代码重构建议，显著提升开发效率。

此次发布是OpenAI拓展苹果生态系统的重要举措，将进一步巩固其在AI编程辅助领域的领先地位。OpenAI透露，macOS版Codex应用已集成最新的GPT-5.3-Codex模型，未来还将支持更多编程语言和框架，预计年内将推出面向Windows和Linux的版本，实现全平台覆盖。

智谱AI发布0.9B轻量级GLM-OCR模型，移动端部署迎来突破

智谱AI今日发布0.9B参数量的轻量级GLM-OCR模型，该模型专为移动端和边缘设备设计，在保持较高识别准确率的同时，大幅降低计算资源需求。新模型支持超过50种语言的文字识别，并针对低光照、倾斜拍摄等复杂场景进行了优化。

GLM-OCR的发布标志着OCR技术在移动端部署的重要突破，将为智能手机、智能摄像头等设备提供更高效的文字识别能力。智谱AI表示，该模型将采用开源策略，并提供完整的部署工具包，预计将吸引更多开发者参与移动端AI应用创新，推动OCR技术在更多场景中的落地应用。

面壁智能开源MiniCPM-o 4.5全模态旗舰模型，AI开源生态再添强援

面壁智能今日宣布开源新一代全模态旗舰模型MiniCPM-o 4.5，该模型在文本理解、图像识别和音频处理方面均达到业界领先水平。新模型采用创新的跨模态注意力机制，实现了多模态信息的深度融合，支持复杂的跨模态推理任务。

MiniCPM-o 4.5的开源将进一步丰富AI开源生态，为全球开发者提供强大的基础模型支持。面壁智能表示，该模型已在多个国际基准测试中取得优异成绩，未来将持续优化模型性能，计划每季度发布一次更新版本，并建立活跃的社区支持体系，推动模型在科研和产业界的广泛应用。

生数科技完成超6亿元A+轮融资，AI视觉领域独角兽加速成长

生数科技今日宣布完成超过6亿元人民币的A+轮融资，本轮融资由多家知名投资机构联合领投。资金将主要用于AI视觉技术研发、产品矩阵扩展以及市场拓展。生数科技专注于计算机视觉和生成式AI领域，已为超过200家企业提供AI视觉解决方案。

本轮融资的完成标志着资本市场对AI视觉领域持续看好，将为生数科技的技术创新和业务扩张提供强劲动力。公司创始人表示，资金将重点投入下一代视觉大模型的研发，计划年内推出面向工业质检、医疗影像等垂直领域的专用模型，进一步巩固其在AI视觉领域的领先地位。

上海AI实验室开源Intern-S1-Pro科学多模态大模型，科研AI迎来新突破

上海人工智能实验室今日宣布开源科学多模态大模型Intern-S1-Pro，该模型专为科学研究设计，支持文本、图像、表格、公式等多种科学数据的综合处理。新模型在科学文献理解、实验数据分析、科学发现预测等方面表现出色，已在多个科学领域的研究中取得突破性成果。

Intern-S1-Pro的开源将加速AI在科学研究领域的应用，为全球科研人员提供强大的AI助手。上海AI实验室表示，该模型已与多家科研机构合作，在药物研发、材料科学、气候变化等领域取得显著进展，未来将持续优化模型性能，计划建立全球科研AI开放平台，促进跨学科合作与创新。

宇树科技开源UnifoLM-VLA-0大模型，具身AI研究迎来新进展

宇树科技今日宣布开源UnifoLM-VLA-0大模型，这是一款专注于具身AI研究的视觉-语言-动作多模态模型。新模型能够理解视觉场景，生成自然语言描述，并输出相应的机器人动作指令，实现了从感知到决策的完整闭环。

UnifoLM-VLA-0的开源将推动具身AI研究的快速发展，为机器人智能化提供新的技术路径。宇树科技表示，该模型已在自家四足机器人上进行了充分测试，能够完成复杂的导航、操作任务，未来将不断优化模型性能，计划推出面向工业、服务、家庭等不同场景的专用版本，推动具身AI技术在更多领域的应用落地。

腾讯"元宝派"AI助手进入内测阶段，智能交互体验全面升级

腾讯今日曝光"元宝派"AI助手内测截图，显示该产品已进入最后测试阶段。据截图显示，"元宝派"具备强大的多轮对话能力，支持个性化定制，能够理解用户意图并提供精准服务。该产品整合了腾讯生态内的多项AI技术，包括自然语言处理、知识图谱和多模态交互等。

"元宝派"的推出标志着腾讯在AI助手领域的重要布局，将进一步丰富腾讯AI产品矩阵。分析人士认为，该产品有望成为腾讯连接用户与各项服务的智能入口，增强用户粘性，同时为腾讯广告、云计算等业务带来新的增长点。腾讯表示，"元宝派"将在完成内测后正式发布，并逐步开放更多功能。

留言评论

2026年2月7日AI前沿情报速递