顺丰同城宣布与火山豆包、腾讯混元等企业合作,推进运营数字化和AI决策智能化,以提升即时配送行业效率。通过DeepSeek开源生态系统和多模态AI能力,实现定制化开发,满足市场多样性需求。此举有助于缩短项目落地周期,增强竞争力。
2025-04-01 16:19
途牛旅游网于4月1日宣布推出自主研发的“AI助手小牛”旅游应用,该应用集成了DeepSeek和通义千问等开源大模型,并针对旅行垂直场景进行优化。用户可通过该应用实现机票、酒店、火车票的快捷查询与预订,同时获得个性化出行建议。此举标志着AI技术在在线旅游领域的进一步应用,有望提升用户体验和决策效率。
2025-04-01 16:18
联想中国区FY25/26财年誓师大会上,执行副总裁兼中国区总裁刘军宣布推出三大AI服务品牌:擎天、百应和想帮帮。这些新品牌标志着联想全面进军AI服务市场,覆盖政企、中小企业和消费客户三大领域。擎天专注于政企客户,提供智能体矩阵、xCloud智能云、AI全周期服务和ESG解决方案;百应则采用AaaS模式,聚焦中小企业在IT运维、AI办公、AI营销等方面的核心需求;而想帮帮则面向多品牌、多设备、多场景的中小企业,提供智能体即服务(AaaS)。此次三大品牌的发布展现了联想在AI时代的战略布局和强大决心。
2025-04-01 16:18
GPT-4o在图像生成领域取得显著成就,ELO评分与Reve并列第一,超越其他模型。该模型在文字排版、商业图像、人物肖像和未来科幻及动漫风格图像生成方面表现卓越,尤其在广告设计、品牌宣传等商业场景中具有明显优势。专家指出,GPT-4o在UI/UX设计方面也表现出色,为设计师提供高效视觉参考。然而,其在自然风景生成和物理空间遵循性方面的局限性提示开发者需进一步优化模型。业界普遍认为GPT-4o的成功得益于其多模态能力,而其他竞争对手则在某些领域表现稍逊。随着GPT-4o功能的集成和普及,其在设计、教育和娱乐等领域的应用潜力将逐步释放。
2025-04-01 16:18
HCLTech 宣布成立新子公司 HCLTech 公共部门解决方案(PSS),专注于推动美国政府机构的人工智能(AI)数字化转型。该子公司将提供综合技术解决方案,服务包括州和地方政府、教育组织以及联邦平民和国防机构。此举反映了公司在公共领域的扩展,特别是在去年11月战略细分市场业务背景下。公司强调专业化解决方案旨在提升 IT 效率并增强政府机构应对技术转型的能力。HCLTech 首席执行官兼董事总经理 C Vijayakumar 表示,专门的子公司将使公司能够更好地与政府机构合作,提升其为公民服务的体验。此外,HCLTech 还被选为三星先进铸造生态系统(SAFE™)计划的设计解决方案合作伙伴,以加速半导体创新。
2025-04-01 16:18
国家天文台与阿里云合作,于2025年4月1日宣布成功构建国际首个太阳大模型“金乌”。该模型基于阿里云的通义千问系列开源模型,在M5级太阳耀斑预报上实现了超过91%的准确率。这一成就标志着人工智能在天文学领域的应用取得了重大突破。太阳耀斑对地球的影响深远,准确预报太阳活动对于维护国家空间安全至关重要。“金乌”模型的开发基于超过90万张太阳卫星图像样本数据,通过输入物理参数及观测图像,能够预测未来24小时内的耀斑爆发情况,并推测下一时段的物理参数和模拟图像。随着太阳观测数据的增加,传统预报方式已难以应对,而大模型技术为太阳预报提供了新的解决方案。
2025-04-01 14:18
2025-04-01 12:18
标题:ChartMoE:探索Sparse MoE结构在下游任务中的应用 摘要: 近期,全球 AI 和机器学习顶会ICLR 2025 Oral 中,来自IDEA、清华大学、北京大学和香港科技大学的团队提出了ChartMoE,这是一个创新的多模态大语言模型,专注于图表(Chart)的理解和生成。该模型通过引入多样化对齐任务来增强模型对图表的理解能力,并保持对其他通用任务的性能。此外,该模型还利用了专家初始化方法来提高模型的异质性,从而获得更全面的视觉表征。 研究动机与主要贡献: 不同于传统的MoE架构,ChartMoE的目标不是扩展模型的容量,而是探究MoE这种稀疏结构在下游任务上的应用。它通过第一阶段的图文对齐来增强模型对图表的理解,同时保持对其他通用任务的性能。此外,ChartMoE利用多样的对齐任务进行专家初始化,加大了专家间的异质性,使得模型能够学习到更全面的视觉表征。 技术细节与实验结果: ChartMoE的训练分为三个阶段:多阶段对齐、广泛学习高质量知识以及领域特定任务的学习。在多阶段对齐阶段,模型仅训练MLP Connector,最后拼成MoE Connector。在广泛学习高质量知识阶段,模型使用MMC-Instruct数据集,包括许多与图表相关的任务,如图表总结和图表分类等。最后,在领域特定任务的学习阶段,模型通过PoT任务来输出代码来解决具体问题。 ChartMoE的表征可视化显示,模型倾向于选择与图表内容最相关的专家,例如数据点、图像元素和图像元素间的交互等。此外,模型在通用领域的性能表现优于直接使用图文对齐的任务,显示出其对图表理解能力的提升。 结论: ChartMoE展示了Sparse MoE结构在下游任务中的潜力和应用价值。通过多样化对齐和专家初始化,模型不仅增强了对图表的理解能力,还保持了在其他通用任务上的性能。这一工作为未来探索Sparse MoE结构在更多下游任务中的应用提供了重要的参考和启示。
2025-04-01 12:17
一种名为CPPO(完成剪枝策略优化)的强化学习算法,它通过选择性地保留具有高优势的完成结果来加速训练过程。实验结果表明,在GSM8K和MATH数据集上,CPPO比GRPO快8.32倍和3.51倍,显示出了显著的性能提升。此外,CPPO还引入了一种动态完成结果分配策略,以进一步提高训练效率。最后,文章还讨论了CPPO的稳定性和收敛性,证明了其稳健而稳定的训练稳定性。
2025-04-01 12:17
一脑多机!智源研究院发布跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,实现单机智能到群体智能的飞跃。 在2025中关村论坛“未来人工智能先锋论坛”上,智源研究院发布了首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,为构建具身智能开源统一生态场景提供底层技术支持。 RoboOS基于“大脑-小脑”分层架构,通过模块化设计、智能任务管理和跨本体协作,为机器人提供高效、灵活、可扩展的底层支持,实现从单机智能到群体智能的跃迁。 RoboOS的核心要素包括具身大脑RoboBrain、小脑技能库以及跨机器人数据中枢,它们共同构成了一个感知 - 认知 - 决策 - 行动的闭环。 RoboBrain由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。在推理时,它首先感知输入视觉信息,将指令分解为一系列可执行子任务,然后执行可操作区域感知和轨迹预测。 RoboOS实现了从单体智能迈向群体智能的转变,通过模块化设计和智能任务管理,为机器人提供高效、灵活、可扩展的底层支持。 此外,RoboOS还提供了端云协作能力,将任务规划为技能粒度,实现云端 RoboBrain 分发规划,端侧执行技能并实时反馈。 RoboOS原生支持异构机器人本体的灵活接入,以 Profile 模板机制快速完成机器人能力建模与适配。 RoboOS基于智源研究院研发的并行训练与推理框架FlagScale,提供了高效的发布 - 订阅机制和基于内存优化的数据访问引擎,满足复杂动态任务的闭环控制需求。 面向机器人在长期运行中产生的海量感知与行为数据,RoboOS提供了基于内存优化的数据访问引擎,支持TB级别历史数据的内存随机访问能力,为任务复现、异常回溯、跨任务知识迁移等场景提供基础能力。结合RoboBrain的任务推理与策略优化模块,历史数据还可用于多机之间的协作知识共享,实现更强的智能演化与自主学习能力。 此次发布的RoboOS及RoboBrain,有机融合和广泛链接不同构型的
2025-04-01 12:17