AI资讯

谷歌DeepMind推出解耦式DiLoCo分布式训练架构，通过将训练过程分散到多个异步、故障隔离的“计算孤岛”中，提升大规模AI模型训练效率，并增强对硬件故障的鲁棒性，克服传统紧密同步易受单点故障影响的局限。

港股市场中，智谱科技和Minimax股价在Deepseek V4发布后显著下跌。Deepseek V4是备受期待的深度学习模型，技术升级和功能增强引发关注，但意外导致这两家大模型概念股回落，引发投资者广泛讨论。

Perplexity首席执行官Aravind Srinivas指出，AI进步不会颠覆智能手机市场，反而会使iPhone演变为“数字护照”。随着AI系统依赖上下文生成结果，存储支付、健康、通信等个人数据的iPhone成为关键基础设施，重要性随AI能力提升而凸显，苹果芯片是长期被低估的优势。

寒武纪宣布完成对DeepSeek-V4全系列模型的“Day0”适配，基于vLLM推理框架，覆盖285B参数Flash版及1.6T参数Pro版。通过自研Torch-MLU-Ops算子库优化稀疏注意力与压缩结构，确保模型发布当日即可在寒武纪硬件上稳定运行，相关代码已开源至GitHub。

游戏行业正广泛采用人工智能，尤其是生成式AI。育碧要求所有应聘者具备相关经验，《ARC Raiders》开发商则用AI彻底改革开发流程。尽管部分3A大作保持谨慎，但AI已成为行业趋势。

寒武纪公司宣布，已成功完成对深度求索公司开源AI模型DeepSeek-V4的Day 0适配，实现发布当天即稳定运行。通过自研融合算子库Torch-MLU-Ops，对模型中的Compressor、mHC等模块进行针对性加速，大幅提升推理效率。同时采用vLLM推理框架，为用户带来更高效的人工智能体验。

美团近日启动万亿参数级AI大模型测试，该模型完全基于国产算力集群训练，标志着国产技术应用取得重大突破。目前仅对受邀用户开放，尚未全面普及，展现了美团在AI领域的领先布局。

DeepSeek于4月24日发布新一代大模型DeepSeek-V4，性能比肩顶级闭源模型，成为开源AI里程碑。它支持100万tokens超长上下文，适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版，分别满足快速迭代与深度应用需求。

昆仑万维2025年报显示，公司营收81.98亿元，同比增长44.78%，海外收入77.23亿元，增长49.91%。公司推出“4+3战略”，明确了AI驱动内容生产的发展方向，涵盖技术与商业布局。

AI编程公司Cursor寻求数十亿美元融资遇阻，其500亿美元估值让多家后期投资机构却步。此前SpaceX曾有意以600亿美元收购，但包括Iconiq在内的顶级基金已明确拒绝。融资遇冷主因是全球资本在AI领域已完成初期布局。