谷歌 DeepMind 推出解耦式 DiLoCo:提升异步训练架构,容忍硬件故障
谷歌DeepMind推出解耦式DiLoCo分布式训练架构,通过将训练过程分散到多个异步、故障隔离的“计算孤岛”中,提升大规模AI模型训练效率,并增强对硬件故障的鲁棒性,克服传统紧密同步易受单点故障影响的局限。
港股大模型股 “深跌”!智谱与 Minimax 在 Deepseek V4 发布后遭遇重创
港股市场中,智谱科技和Minimax股价在Deepseek V4发布后显著下跌。Deepseek V4是备受期待的深度学习模型,技术升级和功能增强引发关注,但意外导致这两家大模型概念股回落,引发投资者广泛讨论。
PerplexityCEO 称 AI 浪潮将强化而非取代iPhone的核心地位
Perplexity首席执行官Aravind Srinivas指出,AI进步不会颠覆智能手机市场,反而会使iPhone演变为“数字护照”。随着AI系统依赖上下文生成结果,存储支付、健康、通信等个人数据的iPhone成为关键基础设施,重要性随AI能力提升而凸显,苹果芯片是长期被低估的优势。
寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码
寒武纪宣布完成对DeepSeek-V4全系列模型的“Day0”适配,基于vLLM推理框架,覆盖285B参数Flash版及1.6T参数Pro版。通过自研Torch-MLU-Ops算子库优化稀疏注意力与压缩结构,确保模型发布当日即可在寒武纪硬件上稳定运行,相关代码已开源至GitHub。
九成游戏开发商悄然使用 AI 技术,谷歌高管揭秘行业现状
游戏行业正广泛采用人工智能,尤其是生成式AI。育碧要求所有应聘者具备相关经验,《ARC Raiders》开发商则用AI彻底改革开发流程。尽管部分3A大作保持谨慎,但AI已成为行业趋势。
寒武纪成功适配 DeepSeek-V4,推动 AI 模型高效运行
寒武纪公司宣布,已成功完成对深度求索公司开源AI模型DeepSeek-V4的Day 0适配,实现发布当天即稳定运行。通过自研融合算子库Torch-MLU-Ops,对模型中的Compressor、mHC等模块进行针对性加速,大幅提升推理效率。同时采用vLLM推理框架,为用户带来更高效的人工智能体验。
美团秘密试水万亿级 AI 大模型!目前仅对受邀用户开放
美团近日启动万亿参数级AI大模型测试,该模型完全基于国产算力集群训练,标志着国产技术应用取得重大突破。目前仅对受邀用户开放,尚未全面普及,展现了美团在AI领域的领先布局。
DeepSeek-V4 发布!性能直逼顶级闭源模型,百万上下文 1 元起
DeepSeek于4月24日发布新一代大模型DeepSeek-V4,性能比肩顶级闭源模型,成为开源AI里程碑。它支持100万tokens超长上下文,适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版,分别满足快速迭代与深度应用需求。
昆仑万维发布 “4+3 战略”:从技术底座到商业闭环
昆仑万维2025年报显示,公司营收81.98亿元,同比增长44.78%,海外收入77.23亿元,增长49.91%。公司推出“4+3战略”,明确了AI驱动内容生产的发展方向,涵盖技术与商业布局。
OpenAI与Anthropic的阴影:Cursor500亿美元融资为何遭大厂投资者拒绝
AI编程公司Cursor寻求数十亿美元融资遇阻,其500亿美元估值让多家后期投资机构却步。此前SpaceX曾有意以600亿美元收购,但包括Iconiq在内的顶级基金已明确拒绝。融资遇冷主因是全球资本在AI领域已完成初期布局。