导航首页 » 资源中心 » 2026年2月7日AI前沿情报速递
2026年2月7日AI前沿情报速递

2026年2月7日AI前沿情报速递

今日AI行业呈现多维度发展态势,大模型迭代加速,应用场景持续拓展,资本活跃度保持高位。国际巨头与本土创新企业竞相推出新一代产品,开源生态日益繁荣,AI技术在垂直领域的落地速度明显加快。监管与自律并重,行业正朝着更加健康有序的方向发展。

可灵AI发布3.0版本,多模态能力全面升级

可灵AI于今日正式发布3.0版本,新版本在多模态理解与生成能力上实现显著突破,支持更复杂的跨模态任务处理。该版本优化了图像识别准确率,提升了文本与图像融合生成质量,并新增了视频内容理解功能,为用户提供更丰富的交互体验。

此次升级标志着可灵AI在多模态领域的技术成熟度达到新高度,将进一步推动AI在创意设计、内容创作等领域的应用落地。可灵AI团队表示,未来将持续优化模型性能,拓展行业解决方案,计划在3个月内推出针对教育、医疗等垂直领域的定制化版本。

阿里大模型品牌正式更名为"千问",战略定位更加清晰

阿里巴巴集团今日宣布,旗下大模型品牌正式从"通义千问"更名为"千问",此举旨在简化品牌架构,强化产品辨识度。新品牌标识更加简洁,同时保留了"千问"这一具有中国文化特色的名称,体现了阿里AI战略的本土化与国际化并重。

品牌更名背后是阿里AI战略的全面升级,未来"千问"将作为阿里AI业务的统一品牌,涵盖大模型、AI应用开发平台及行业解决方案。分析人士认为,这一调整有助于阿里整合内部AI资源,提升市场竞争力,同时为即将推出的30亿元红包活动奠定品牌基础。

Mistral AI推出Voxtral Transcribe 2语音模型,准确率提升40%

法国AI企业Mistral AI今日发布Voxtral Transcribe 2语音模型,该模型在多语言语音识别准确率上较前代提升40%,支持超过100种语言的实时转录。新模型采用先进的声纹识别技术,能够在嘈杂环境中保持高识别率,并支持说话人分离功能。

Voxtral Transcribe 2的发布将进一步推动语音AI在会议记录、客服系统、媒体内容制作等领域的应用。Mistral AI表示,该模型将作为开源版本发布,同时提供企业级定制服务,预计将在全球范围内吸引更多开发者参与语音AI生态建设。

支付宝首次上线AI眼镜扫福功能,开启AR支付新体验

支付宝今日宣布,首次上线AI眼镜扫福功能,用户通过佩戴支持AR功能的智能眼镜,即可扫描实体福字获取数字红包。该功能结合了计算机视觉与增强现实技术,实现了现实世界与数字内容的无缝融合,为春节传统习俗注入科技元素。

此次合作标志着支付宝在AR支付领域的重要突破,将为智能硬件厂商带来新的商业机会。支付宝团队透露,未来将拓展更多基于AR的支付场景,包括虚拟试衣、室内导航等,预计年内将支持超过1000款智能眼镜设备接入该功能。

昆仑万维发布天工Skywork桌面版,AI创作工具生态进一步完善

昆仑万维今日正式发布天工Skywork桌面版,这是一款集文本创作、图像生成、视频剪辑于一体的AI创作工具。桌面版保留了云端版本的核心功能,并针对本地化使用进行了优化,支持离线模式,满足创作者在不同网络环境下的使用需求。

天工Skywork桌面版的推出进一步完善了昆仑万维的AI创作工具生态,为创作者提供更加灵活的工作方式。昆仑万维表示,未来将持续丰富桌面版功能,计划在第二季度加入3D模型生成能力,并推出针对专业创作者的高级版本,进一步巩固其在AI创作领域的技术优势。

OpenAI推出macOS版Codex应用,开发者体验全面升级

OpenAI今日正式发布macOS版的Codex应用,为苹果开发者提供更高效的编程辅助工具。新应用针对macOS系统进行了深度优化,支持Xcode集成,能够提供实时代码补全、错误检测和代码重构建议,显著提升开发效率。

此次发布是OpenAI拓展苹果生态系统的重要举措,将进一步巩固其在AI编程辅助领域的领先地位。OpenAI透露,macOS版Codex应用已集成最新的GPT-5.3-Codex模型,未来还将支持更多编程语言和框架,预计年内将推出面向Windows和Linux的版本,实现全平台覆盖。

智谱AI发布0.9B轻量级GLM-OCR模型,移动端部署迎来突破

智谱AI今日发布0.9B参数量的轻量级GLM-OCR模型,该模型专为移动端和边缘设备设计,在保持较高识别准确率的同时,大幅降低计算资源需求。新模型支持超过50种语言的文字识别,并针对低光照、倾斜拍摄等复杂场景进行了优化。

GLM-OCR的发布标志着OCR技术在移动端部署的重要突破,将为智能手机、智能摄像头等设备提供更高效的文字识别能力。智谱AI表示,该模型将采用开源策略,并提供完整的部署工具包,预计将吸引更多开发者参与移动端AI应用创新,推动OCR技术在更多场景中的落地应用。

面壁智能开源MiniCPM-o 4.5全模态旗舰模型,AI开源生态再添强援

面壁智能今日宣布开源新一代全模态旗舰模型MiniCPM-o 4.5,该模型在文本理解、图像识别和音频处理方面均达到业界领先水平。新模型采用创新的跨模态注意力机制,实现了多模态信息的深度融合,支持复杂的跨模态推理任务。

MiniCPM-o 4.5的开源将进一步丰富AI开源生态,为全球开发者提供强大的基础模型支持。面壁智能表示,该模型已在多个国际基准测试中取得优异成绩,未来将持续优化模型性能,计划每季度发布一次更新版本,并建立活跃的社区支持体系,推动模型在科研和产业界的广泛应用。

生数科技完成超6亿元A+轮融资,AI视觉领域独角兽加速成长

生数科技今日宣布完成超过6亿元人民币的A+轮融资,本轮融资由多家知名投资机构联合领投。资金将主要用于AI视觉技术研发、产品矩阵扩展以及市场拓展。生数科技专注于计算机视觉和生成式AI领域,已为超过200家企业提供AI视觉解决方案。

本轮融资的完成标志着资本市场对AI视觉领域持续看好,将为生数科技的技术创新和业务扩张提供强劲动力。公司创始人表示,资金将重点投入下一代视觉大模型的研发,计划年内推出面向工业质检、医疗影像等垂直领域的专用模型,进一步巩固其在AI视觉领域的领先地位。

上海AI实验室开源Intern-S1-Pro科学多模态大模型,科研AI迎来新突破

上海人工智能实验室今日宣布开源科学多模态大模型Intern-S1-Pro,该模型专为科学研究设计,支持文本、图像、表格、公式等多种科学数据的综合处理。新模型在科学文献理解、实验数据分析、科学发现预测等方面表现出色,已在多个科学领域的研究中取得突破性成果。

Intern-S1-Pro的开源将加速AI在科学研究领域的应用,为全球科研人员提供强大的AI助手。上海AI实验室表示,该模型已与多家科研机构合作,在药物研发、材料科学、气候变化等领域取得显著进展,未来将持续优化模型性能,计划建立全球科研AI开放平台,促进跨学科合作与创新。

宇树科技开源UnifoLM-VLA-0大模型,具身AI研究迎来新进展

宇树科技今日宣布开源UnifoLM-VLA-0大模型,这是一款专注于具身AI研究的视觉-语言-动作多模态模型。新模型能够理解视觉场景,生成自然语言描述,并输出相应的机器人动作指令,实现了从感知到决策的完整闭环。

UnifoLM-VLA-0的开源将推动具身AI研究的快速发展,为机器人智能化提供新的技术路径。宇树科技表示,该模型已在自家四足机器人上进行了充分测试,能够完成复杂的导航、操作任务,未来将不断优化模型性能,计划推出面向工业、服务、家庭等不同场景的专用版本,推动具身AI技术在更多领域的应用落地。

腾讯"元宝派"AI助手进入内测阶段,智能交互体验全面升级

腾讯今日曝光"元宝派"AI助手内测截图,显示该产品已进入最后测试阶段。据截图显示,"元宝派"具备强大的多轮对话能力,支持个性化定制,能够理解用户意图并提供精准服务。该产品整合了腾讯生态内的多项AI技术,包括自然语言处理、知识图谱和多模态交互等。

"元宝派"的推出标志着腾讯在AI助手领域的重要布局,将进一步丰富腾讯AI产品矩阵。分析人士认为,该产品有望成为腾讯连接用户与各项服务的智能入口,增强用户粘性,同时为腾讯广告、云计算等业务带来新的增长点。腾讯表示,"元宝派"将在完成内测后正式发布,并逐步开放更多功能。

留言评论
本站统计

已开设分类:10

已收录站点:747

最高日览站:高清影视

最高月览站:高清影视

最高总览站:Instagram

最高点赞站:腾讯智影

正申请站点:0

已拒绝站点:1

文章的分类:14

已发布文章:435

已发布公告:1

已交换友链:1

本站已稳定运行了 天。

❤️ 感谢您的支持