2026年2月12日AI前沿情报速递
今日AI领域呈现出多模态模型加速迭代、大模型开源生态持续繁荣、AI应用场景不断拓展的态势。从蚂蚁开源Ming-flash-omni 2.0到腾讯混元推出产业级2Bit端侧模型,从阿里大品牌更名为千问到讯飞星火X2发布,各大科技巨头竞相布局AI前沿技术。同时,AI支付、AI眼镜扫福等创新应用场景落地加速,预示着AI技术正从实验室走向更广泛的商业应用。
蚂蚁集团开源Ming-flash-omni 2.0大模型
蚂蚁集团于2月12日正式开源其最新大模型Ming-flash-omni 2.0,这是继1.0版本后的重大升级。新模型在多语言理解、长文本处理和复杂推理能力方面均有显著提升,参数规模达到2000亿,支持128K上下文窗口。Ming-flash-omni 2.0采用混合专家架构,训练数据涵盖100多种语言,特别增强了对中文、英文和阿拉伯语的理解能力。
此次开源标志着蚂蚁集团在AI基础设施领域的战略布局进一步深化。Ming-flash-omni 2.0的开放将促进全球开发者社区在多语言AI应用方面的创新,特别是在金融、教育和医疗等垂直领域的应用探索。蚂蚁计划在未来三个月内推出基于该模型的开发者平台,并提供完整的API和工具链,降低企业级AI应用开发门槛。
智谱AI GLM-5模型意外泄露引发行业关注
智谱AI的GLM-5大模型于2月12日被意外泄露到部分开发者社区,引发广泛关注。据初步分析,泄露版本包含GLM-5的基础架构和部分训练数据,但未包含完整的模型权重和核心参数。GLM-5作为智谱AI的最新旗舰模型,在逻辑推理、代码生成和知识问答方面表现优异,参数规模超过1500亿。
此次意外泄露虽对智谱AI造成一定影响,但也意外提升了模型在开发者社区的知名度。业内专家认为,这可能会加速GLM-5生态系统的形成,促进第三方应用开发。智谱AI已发布声明,正在调查泄露原因,并表示将加强安全措施。同时,公司计划在3月正式发布GLM-5的商业版本,提供企业级解决方案。
京东正式入局AI支付领域
京东于2月12日正式宣布进军AI支付领域,推出基于大语言模型的智能支付助手"京小智"。该助手能够理解用户自然语言支付指令,支持复杂场景下的智能推荐和支付决策。京东支付团队表示,"京小智"已接入京东商城、京东金融等多个平台,首批服务覆盖北京、上海、广州等10个主要城市。
京东入局AI支付将加剧该领域的竞争格局,推动支付行业向更智能化、个性化方向发展。与传统支付工具相比,AI支付助手能够基于用户消费习惯和场景提供更精准的服务,有望提升用户体验和支付效率。京东计划在2026年底前将"京小智"推广至全国100个城市,并与超过50万家商户建立合作,构建完整的AI支付生态。
字节跳动发布Seedance 2.0视频模型
字节跳动于2月12日发布新一代视频生成模型Seedance 2.0,该模型在视频生成质量、生成速度和长视频处理能力方面实现重大突破。Seedance 2.0支持1080P分辨率视频生成,单分钟视频生成时间缩短至5分钟,并能处理超过10分钟的长视频内容。模型采用全新的时空注意力机制,显著提升了视频连贯性和细节表现。
Seedance 2.0的发布将进一步推动AIGC(AI生成内容)行业的发展,特别是在短视频、广告和影视制作领域的应用。字节跳动表示,Seedance 2.0将于3月开放API接口,面向内容创作者和媒体机构提供服务。业内分析师认为,这一技术突破可能重塑内容创作流程,降低专业视频制作的门槛,同时为字节跳动在短视频和长视频领域带来新的竞争优势。
小红书秘密研发AI剪辑器OpenStoryline
小红书于2月12日被曝正在秘密研发AI视频剪辑工具OpenStoryline,该项目已进入内测阶段。据知情人士透露,OpenStoryline能够自动分析视频内容,智能识别关键场景和情感节点,并提供个性化剪辑建议。该工具特别针对社交媒体短视频优化,支持一键生成多平台适配的短视频内容。
OpenStoryline的推出将强化小红书在内容创作生态中的布局,提升用户创作效率和质量。随着短视频市场竞争加剧,AI辅助创作工具成为平台差异化竞争的关键。小红书计划在2026年第二季度正式推出OpenStoryline,并逐步开放给创作者使用。此举可能引发短视频创作工具新一轮的技术竞赛,推动AI在内容创作领域的深度应用。
神秘AI模型"Pony Alpha"曝光
一个名为"Pony Alpha"的神秘AI模型于2月12日在开发者社区引发关注。据泄露的信息显示,Pony Alpha是一个专注于多模态理解的通用模型,能够同时处理文本、图像、音频和视频数据。模型采用创新的跨模态注意力机制,在少样本学习场景下表现优异,参数规模估计在1000亿左右。
Pony Alpha的曝光引发业界对其开发背景和应用前景的猜测。有分析认为,这可能是由一家科技巨头秘密研发的下一代通用AI模型。该模型在多模态理解方面的突破可能为人机交互带来革命性变化,特别是在虚拟助手、智能教育等领域。目前,尚无官方确认关于Pony Alpha的信息,但其技术特点已引起AI研究人员的广泛关注,可能成为未来多模态AI发展的重要参考方向。
可灵AI发布可灵3.0模型
可灵AI于2月12日正式发布其第三代大模型可灵3.0,新模型在代码生成、数学推理和创意写作方面实现显著提升。可灵3.0采用创新的动态稀疏激活技术,在保持高性能的同时降低了30%的计算资源需求。模型支持超过50种编程语言的代码生成,并能理解复杂的数学问题并提供详细解题步骤。
可灵3.0的发布将进一步推动AI在软件开发和教育领域的应用。可灵AI宣布,将开放API接口,并提供针对企业和教育机构的定制化解决方案。业内专家认为,可灵3.0在代码生成方面的突破可能显著提升软件开发效率,特别是在重复性编码和代码优化方面。同时,模型在数学教育中的应用有望为学生提供个性化学习体验,改变传统教育模式。
阿里大模型品牌正式更名为千问
阿里巴巴于2月12日宣布,其大模型品牌正式更名为"千问",取代原有的"通义千问"名称。此次品牌重塑旨在强化阿里AI产品的统一性和辨识度。千问品牌将涵盖阿里所有大模型相关产品和服务,包括基础大模型、行业解决方案和开发者平台。阿里云智能事业群表示,新品牌名称取自"千问不倒"的寓意,象征AI模型的强大能力。
品牌更名为千问是阿里AI战略的重要调整,有助于整合内部资源,提升市场竞争力。阿里计划在未来一年内投入100亿元用于千问生态建设,包括技术研发、人才培养和产业合作。分析师认为,这一举措将加速阿里AI技术在电商、金融、物流等核心业务场景的落地,同时为阿里云带来新的增长点。千问品牌的推出也标志着中国科技巨头在AI领域的竞争进入新阶段,品牌战略成为差异化竞争的重要手段。
Mistral AI发布Voxtral Transcribe 2语音模型
欧洲AI公司Mistral AI于2月12日发布新一代语音识别模型Voxtral Transcribe 2,该模型在多语言语音识别和噪声环境下的识别准确率方面实现重大突破。Voxtral Transcribe 2支持超过30种语言的实时语音识别,在嘈杂环境下的识别准确率比前代产品提升25%,响应时间缩短至200毫秒以内。
Voxtral Transcribe 2的发布将进一步推动语音交互技术在全球范围内的应用,特别是在多语言场景下的普及。Mistral AI表示,该模型已集成到公司的企业语音服务平台,将为全球客户提供实时语音转写、会议记录和语音搜索等服务。业内专家认为,随着全球化和远程办公的普及,对高质量多语言语音识别的需求将持续增长,Voxtral Transcribe 2的推出有望在这一领域占据领先地位。
支付宝上线AI眼镜扫福功能
支付宝于2月12日首次上线AI眼镜扫福功能,用户通过佩戴支持支付宝功能的智能眼镜,即可扫描二维码、识别商品并进行支付。该功能基于支付宝的AI视觉识别和AR技术,支持离线支付和身份验证。支付宝团队表示,这一创新将改变传统移动支付方式,为用户提供更便捷的"无感支付"体验。
AI眼镜扫福功能的推出标志着支付宝在无感支付领域的重要布局,也是AI技术与可穿戴设备结合的典型案例。支付宝计划在未来一年内与多家智能眼镜厂商合作,扩大这一功能的应用场景。分析师认为,随着AR和AI技术的成熟,无感支付可能成为未来支付的重要趋势,特别是在零售、交通和医疗等场景。支付宝此举将巩固其在移动支付领域的领先地位,同时为用户带来更智能、更便捷的支付体验。
昆仑万维发布天工Skywork桌面版
昆仑万维于2月12日发布天工Skywork桌面版,这是其大模型产品线的重要延伸。天工Skywork桌面版集成了文本生成、图像创作、代码助手和数据分析等多种AI功能,支持离线使用和云端同步。该产品采用模块化设计,用户可根据需求选择不同功能模块,实现个性化定制。
天工Skywork桌面版的发布将AI能力从云端延伸到本地设备,满足用户对数据隐私和离线使用的需求。昆仑万维表示,该产品主要面向创意工作者、开发者和研究人员,提供专业级的AI辅助工具。业内专家认为,随着AI技术的普及,本地化AI应用将成为重要趋势,天工Skywork桌面版的推出有望在这一领域占据先机,同时为昆仑万维开辟新的商业增长点。
讯飞星火X2大模型正式发布
科大讯飞于2月12日正式发布新一代大模型讯飞星火X2,该模型在多模态理解、知识问答和逻辑推理方面实现全面升级。讯飞星火X2采用创新的混合架构,参数规模达到1800亿,支持文本、图像、语音和视频的多模态处理。模型在中文理解能力方面表现尤为突出,特别是在专业领域知识的理解和应用方面。
讯飞星火X2的发布将进一步巩固科大讯飞在AI语音和认知智能领域的领先地位。科大讯飞宣布,同步上线API接口,为企业提供大模型服务。同时,星火X2将深度整合到讯飞的教育、医疗和办公等产品线中,提升用户体验。业内分析师认为,讯飞星火X2的推出将加速AI技术在各行业的落地,特别是在教育信息化和智慧医疗领域的应用,为科大讯飞带来新的增长机遇。
阿里达摩院开源具身智能大脑基础模型RynnBrain
阿里达摩院于2月12日开源具身智能大脑基础模型RynnBrain,这是中国在具身智能领域的重要开源项目。RynnBrain结合了视觉感知、运动控制和决策规划等多种AI能力,能够模拟人类在物理环境中的智能行为。模型采用分层架构,包括感知层、认知层和行为层,支持机器人自主导航、物体操作和人机交互等任务。
R




