机器之心的AI技术文章《DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文》中,探讨了在深度学习和人工智能领域内,推理模型的发展及其对性能提升的影响。文章强调了通过多种技术手段,如思维链(CoT)、测试时间扩展(Test-Time Scaling)等策略,实现了模型决策路径的可解释性,以及在推理阶段动态分配计算资源以处理复杂子问题。此外,研究还涉及了训练强化、增加训练计算与推理计算等方法,旨在增强模型能力并优化推理过程。 具体而言,文章指出,通过结合强化学习、对抗训练等方法,利用高难度推理任务数据集进行微调,可以显著提升符号推理与逻辑连贯性。同时,通过扩展训练数据量、强化学习或针对特定任务的微调来增强模型能力;增加推理计算,即在模型生成输出时分配更多计算资源,允许模型 “思考更长时间” 或执行更复杂的推理步骤。 此外,文章还介绍了一些具体的技术进展和研究成果,例如: - 使用蒙特卡洛树搜索(MCTS)算法进行结构化探索,帮助模型在决策过程中进行多步骤的推理。 - 关联记忆机制,一种用于集成新的关键信息的动态机制,能够根据上下文和推理过程中的需要,不断更新和补充相关信息,从而增强模型的自适应学习能力。 - 抽象阶段和推理阶段的转换,模型首先被要求回答一个更一般的问题,这个问题是对原始具体问题的抽象。基于抽象阶段得到的一般结论,模型再回到具体问题上进行推理,从而得出最终的答案。 这些研究不仅展示了推理模型在性能提升方面的努力,也反映了当前深度学习和人工智能领域的发展趋势和挑战。
2025-04-01 16:19
欧莱雅集团发起的美妆科技黑客松大赛【科技大 FUN 颂】正式启动,旨在通过智能体技术创新探索美妆行业的数字化未来。比赛分为四个赛道:创智体验家、内容鉴查官、数据解构师、风控守护神,聚焦AI美妆解决方案、AI内容审核、商业智能分析、AI的安全可靠等四大领域。大赛提供丰厚的奖金和产业资源,鼓励参赛者通过脑力竞技开启职业发展。此外,大赛还设有人气争夺战和训练营 Workshop,为晋级决赛的队伍提供技术和指导支持。欧莱雅中国期待与开发者共同探索美妆行业的数字化未来。
2025-04-01 16:19
顺丰同城宣布与火山豆包、腾讯混元等企业合作,推进运营数字化和AI决策智能化,以提升即时配送行业效率。通过DeepSeek开源生态系统和多模态AI能力,实现定制化开发,满足市场多样性需求。此举有助于缩短项目落地周期,增强竞争力。
2025-04-01 16:19
途牛旅游网于4月1日宣布推出自主研发的“AI助手小牛”旅游应用,该应用集成了DeepSeek和通义千问等开源大模型,并针对旅行垂直场景进行优化。用户可通过该应用实现机票、酒店、火车票的快捷查询与预订,同时获得个性化出行建议。此举标志着AI技术在在线旅游领域的进一步应用,有望提升用户体验和决策效率。
2025-04-01 16:18
联想中国区FY25/26财年誓师大会上,执行副总裁兼中国区总裁刘军宣布推出三大AI服务品牌:擎天、百应和想帮帮。这些新品牌标志着联想全面进军AI服务市场,覆盖政企、中小企业和消费客户三大领域。擎天专注于政企客户,提供智能体矩阵、xCloud智能云、AI全周期服务和ESG解决方案;百应则采用AaaS模式,聚焦中小企业在IT运维、AI办公、AI营销等方面的核心需求;而想帮帮则面向多品牌、多设备、多场景的中小企业,提供智能体即服务(AaaS)。此次三大品牌的发布展现了联想在AI时代的战略布局和强大决心。
2025-04-01 16:18
GPT-4o在图像生成领域取得显著成就,ELO评分与Reve并列第一,超越其他模型。该模型在文字排版、商业图像、人物肖像和未来科幻及动漫风格图像生成方面表现卓越,尤其在广告设计、品牌宣传等商业场景中具有明显优势。专家指出,GPT-4o在UI/UX设计方面也表现出色,为设计师提供高效视觉参考。然而,其在自然风景生成和物理空间遵循性方面的局限性提示开发者需进一步优化模型。业界普遍认为GPT-4o的成功得益于其多模态能力,而其他竞争对手则在某些领域表现稍逊。随着GPT-4o功能的集成和普及,其在设计、教育和娱乐等领域的应用潜力将逐步释放。
2025-04-01 16:18
HCLTech 宣布成立新子公司 HCLTech 公共部门解决方案(PSS),专注于推动美国政府机构的人工智能(AI)数字化转型。该子公司将提供综合技术解决方案,服务包括州和地方政府、教育组织以及联邦平民和国防机构。此举反映了公司在公共领域的扩展,特别是在去年11月战略细分市场业务背景下。公司强调专业化解决方案旨在提升 IT 效率并增强政府机构应对技术转型的能力。HCLTech 首席执行官兼董事总经理 C Vijayakumar 表示,专门的子公司将使公司能够更好地与政府机构合作,提升其为公民服务的体验。此外,HCLTech 还被选为三星先进铸造生态系统(SAFE™)计划的设计解决方案合作伙伴,以加速半导体创新。
2025-04-01 16:18
国家天文台与阿里云合作,于2025年4月1日宣布成功构建国际首个太阳大模型“金乌”。该模型基于阿里云的通义千问系列开源模型,在M5级太阳耀斑预报上实现了超过91%的准确率。这一成就标志着人工智能在天文学领域的应用取得了重大突破。太阳耀斑对地球的影响深远,准确预报太阳活动对于维护国家空间安全至关重要。“金乌”模型的开发基于超过90万张太阳卫星图像样本数据,通过输入物理参数及观测图像,能够预测未来24小时内的耀斑爆发情况,并推测下一时段的物理参数和模拟图像。随着太阳观测数据的增加,传统预报方式已难以应对,而大模型技术为太阳预报提供了新的解决方案。
2025-04-01 14:18
2025-04-01 12:18
标题:ChartMoE:探索Sparse MoE结构在下游任务中的应用 摘要: 近期,全球 AI 和机器学习顶会ICLR 2025 Oral 中,来自IDEA、清华大学、北京大学和香港科技大学的团队提出了ChartMoE,这是一个创新的多模态大语言模型,专注于图表(Chart)的理解和生成。该模型通过引入多样化对齐任务来增强模型对图表的理解能力,并保持对其他通用任务的性能。此外,该模型还利用了专家初始化方法来提高模型的异质性,从而获得更全面的视觉表征。 研究动机与主要贡献: 不同于传统的MoE架构,ChartMoE的目标不是扩展模型的容量,而是探究MoE这种稀疏结构在下游任务上的应用。它通过第一阶段的图文对齐来增强模型对图表的理解,同时保持对其他通用任务的性能。此外,ChartMoE利用多样的对齐任务进行专家初始化,加大了专家间的异质性,使得模型能够学习到更全面的视觉表征。 技术细节与实验结果: ChartMoE的训练分为三个阶段:多阶段对齐、广泛学习高质量知识以及领域特定任务的学习。在多阶段对齐阶段,模型仅训练MLP Connector,最后拼成MoE Connector。在广泛学习高质量知识阶段,模型使用MMC-Instruct数据集,包括许多与图表相关的任务,如图表总结和图表分类等。最后,在领域特定任务的学习阶段,模型通过PoT任务来输出代码来解决具体问题。 ChartMoE的表征可视化显示,模型倾向于选择与图表内容最相关的专家,例如数据点、图像元素和图像元素间的交互等。此外,模型在通用领域的性能表现优于直接使用图文对齐的任务,显示出其对图表理解能力的提升。 结论: ChartMoE展示了Sparse MoE结构在下游任务中的潜力和应用价值。通过多样化对齐和专家初始化,模型不仅增强了对图表的理解能力,还保持了在其他通用任务上的性能。这一工作为未来探索Sparse MoE结构在更多下游任务中的应用提供了重要的参考和启示。
2025-04-01 12:17