AI行业速览|2026年1月30日焦点观察
2026年1月30日,AI行业呈现多模态技术突破与开源生态繁荣的双重趋势。一方面,各大科技巨头加速多模态模型研发,如腾讯混元图像3.0、蚂蚁灵波世界模型等相继开源;另一方面,音乐生成、视频创作等领域迎来技术革新,MiniMax Music 2.5与昆仑万维SkyReels-V3等模型重新定义创作边界。同时,行业整合加速,苹果20亿美元收购以色列AI公司Q.ai,预示着AI技术在消费电子领域的深度融合即将展开。
腾讯混元图像3.0正式开源 多模态能力再升级
腾讯于1月30日正式开源混元图像3.0模型,该模型在图生图任务上表现出色,支持高精度图像生成与编辑。混元图像3.0采用了最新的多模态融合技术,能够理解文本描述并生成高质量图像,同时具备图像风格迁移、局部编辑等高级功能。此次开源标志着腾讯在AI视觉领域的进一步开放,开发者可通过官方平台获取模型权重和训练代码。
混元图像3.0的开源将极大推动国内AI视觉应用生态的发展,特别是在创意设计、电商展示等领域。腾讯表示,未来将持续优化模型性能,并计划推出更多针对特定行业的定制化版本。这一举措也反映了国内科技巨头在AI开源战略上的积极布局,有助于提升中国在全球AI技术竞争中的话语权。
蚂蚁灵波开源世界模型LingBot-World 多模态理解能力突破
蚂蚁集团于1月30日宣布开源其自主研发的世界模型LingBot-World,该模型具备强大的多模态理解与生成能力,能够同时处理文本、图像、视频等多种类型的数据。LingBot-World采用了创新的注意力机制和知识蒸馏技术,在保持模型轻量化的同时实现了接近百亿级参数模型的性能表现。
这一开源项目对AI社区具有重要意义,它为研究大模型的高效训练与部署提供了新思路。蚂蚁集团表示,LingBot-World将重点应用于智能客服、金融风控等领域,未来计划与高校和研究机构合作,进一步拓展模型的应用场景。该模型的发布也显示了中国企业在基础AI模型研发方面的实力正在快速提升。
MiniMax Music 2.5发布 格莱美级音乐创作能力
AI音乐创作公司MiniMax于1月30日发布了其最新一代音乐生成模型Music 2.5,该模型在音乐质量、创作自由度和实用性方面均取得显著突破。Music 2.5能够生成接近专业录音棚水准的完整音乐作品,支持多种风格和乐器组合,甚至可以根据用户情感需求调整音乐表达。
Music 2.5的发布标志着AI音乐创作进入新阶段,它不仅降低了音乐制作门槛,还为专业音乐人提供了强大的创作辅助工具。MiniMax宣布,该模型将首先面向内容创作者和音乐教育机构开放,未来计划推出面向个人用户的订阅服务。这一技术突破也引发了音乐产业对AI创作伦理和版权问题的新一轮讨论。
昆仑万维开源视频生成模型SkyReels-V3
昆仑万维于1月30日正式开源视频生成模型SkyReels-V3,该模型在视频质量、生成速度和可控性方面均达到业界领先水平。SkyReels-V3采用了创新的时空注意力机制,能够生成长达30秒的高清视频,并支持风格迁移、角色一致性保持等高级功能。开发者可通过昆仑万维官方平台获取模型和工具链。
SkyReels-V3的开源将极大推动AI视频生成技术的发展,特别是在短视频创作、虚拟现实等领域。昆仑万维表示,未来将持续优化模型性能,并计划推出面向企业的商业解决方案。这一举措也反映了国内AI企业在视频生成领域的激烈竞争,预示着2026年将成为AI视频技术爆发的一年。
谷歌Gemini 3.5泄露 多模态能力再创新高
据1月30日泄露的信息显示,谷歌正在内部测试Gemini 3.5模型,该模型在多模态理解和生成能力上实现重大突破。Gemini 3.5不仅能够处理文本、图像、音频等传统模态,还新增了对3D模型和视频流的支持,在复杂推理任务上的表现较前代提升40%以上。
这一泄露信息引发了业界广泛关注,分析人士认为,Gemini 3.5的正式发布将进一步加剧AI大模型市场的竞争格局。谷歌尚未就此事发表官方声明,但预计将在未来几周内举办相关发布会。Gemini系列的持续创新也显示,谷歌正试图通过技术优势重新确立其在AI领域的领导地位。
阿里发布推理模型Qwen3-Max-Thinking
阿里巴巴于1月30日发布了其最新研发的推理模型Qwen3-Max-Thinking,该模型专注于复杂逻辑推理和决策支持能力。Qwen3-Max-Thinking采用了创新的思维链技术,能够模拟人类思考过程,在数学推理、代码生成和复杂问题解决等任务上表现出色。
这一模型的发布标志着阿里在AI推理能力上的重要突破,预计将广泛应用于企业级决策支持系统、智能客服和金融风控等领域。阿里云表示,Qwen3-Max-Thinking将作为其AI云服务的重要组成部分,为企业客户提供更强大的AI推理能力。这一技术进展也显示,国内科技巨头正从通用大模型向专业化、垂直化方向发展。
Claude深度集成Slack 办公AI助手迎来新突破
Anthropic于1月30日宣布,其AI助手Claude已深度集成Slack办公平台,用户可以直接在Slack中调用Claude的强大功能。此次集成包括智能会议总结、邮件自动回复、文档分析等多项实用功能,大大提升了团队协作效率。
Claude与Slack的深度整合代表了AI助手在办公场景中的重要应用进展,它不仅提高了工作效率,还改变了传统的办公模式。Anthropic表示,未来将进一步拓展Claude在企业服务中的应用场景,包括CRM系统、项目管理工具等。这一趋势也显示,AI正从通用助手向专业化、场景化方向发展,成为企业数字化转型的重要驱动力。
苹果20亿美元收购以色列AI公司Q.ai
苹果公司于1月30日宣布,将以20亿美元收购以色列AI公司Q.ai,这笔交易预计将在2026年第二季度完成。Q.ai专注于边缘计算AI技术,其低功耗、高效率的AI芯片和算法在移动设备上表现出色,特别适合在iPhone和iPad等设备上运行大型AI模型。
此次收购是苹果近年来最大规模的AI领域投资,反映了其对AI技术的高度重视。分析人士认为,Q.ai的技术将帮助苹果提升其在设备端AI处理能力,减少对云端计算的依赖,增强用户隐私保护。这一收购也预示着AI技术将成为苹果未来产品差异化的重要方向,特别是在增强现实、健康监测等领域。
宇树开源UnifoLM-VLA-0大模型 多语言理解能力领先
宇树科技于1月30日宣布开源其最新研发的大模型UnifoLM-VLA-0,该模型在多语言理解和生成方面表现出色,支持包括中文、英文、西班牙语等在内的100多种语言。UnifoLM-VLA-采用了创新的跨语言注意力机制,能够在不同语言间实现知识的迁移和共享。
这一开源项目对全球AI社区具有重要意义,它为构建真正意义上的多语言AI系统提供了基础。宇树科技表示,未来将继续优化模型性能,并计划推出更多针对特定语言和文化的定制化版本。UnifoLM-VLA-0的发布也显示,中国AI企业在国际化布局和全球化技术贡献方面正在发挥越来越重要的作用。
Kimi K2.5上线 代码生成能力全面升级
月之暗面于1月30日发布了其AI助手Kimi的升级版本K2.5,该版本在代码生成和编程辅助能力上实现重大突破。K2.5不仅能够理解复杂的编程需求,还能生成高质量、可执行的代码,支持包括Python、Java、C++在内的20多种主流编程语言。
Kimi K2.5的发布标志着AI编程助手进入新阶段,它不仅能提高开发效率,还能帮助初学者学习编程。月之暗面表示,K2.5将重点面向软件开发企业和教育机构,未来计划推出更多针对特定编程场景的功能模块。这一技术进展也反映了AI在专业领域应用的深入,正逐步改变传统软件开发模式。
OpenAI宣布2月13日下线GPT-4o等旧模型
OpenAI于1月30日宣布,将于2月13日正式下线GPT-4o等旧模型,用户需提前迁移至新平台。这一决定反映了OpenAI对其产品线的战略调整,旨在集中资源支持更先进的大模型研发和应用。OpenAI表示,旧模型下线后,将把更多计算资源投入到新一代模型的训练和优化中。
这一消息引发广泛关注,特别是对依赖OpenAI API的开发者而言。OpenAI承诺将提供详细的迁移指南和技术支持,确保平稳过渡。这一举措也显示,AI大模型市场正进入快速迭代期,企业需要不断更新技术栈以保持竞争力。同时,这也引发了关于AI模型可持续性和电子垃圾问题的讨论,如何在技术进步与资源节约间取得平衡成为行业面临的重要课题。




