华中科技大学和小米汽车联合开发的ORION框架,通过结合视觉语言模型(VLM)与生成模型,实现了端到端自动驾驶的精度提升19.61%,显著优化了闭环环境中的驾驶决策能力。该框架在Bench2Drive数据集上展示了卓越的性能,特别是在理解复杂场景中的因果关系、执行精确的驾驶决策以及规划轨迹方面。此外,ORION的代码和数据集计划开源,为学术界和工业界提供了进一步研究和应用的可能。
2025-04-10 16:59
GEAL 技术通过将2D模型的语义理解与3D数据的空间几何细节相结合,实现了对三维场景中可交互区域的精确预测。这项技术无需额外收集和标注大规模3D数据,而是利用2D基础模型来提升对3D场景的理解能力。 GEAL的核心在于其独特的跨模态对齐机制,它允许2D视觉模型与3D空间特征进行有效融合。这种对齐策略不仅提高了模型在各种噪声环境下的稳定性,还增强了其在真实复杂场景中的泛化能力。此外,GEAL还引入了颗粒度自适应融合模块和一致性对齐模块,进一步优化了2D和3D特征的融合过程,确保了模型在处理不同层级的细节时能够保持整体性和准确性。 实验结果表明,GEAL在多个公共数据集上的表现优于现有方法,特别是在未知类别测试中仍能保持高准确率。这一成果证明了GEAL在3D Affordance Learning领域的有效性,为机器人操作、增强现实和智能家居等领域提供了一种灵活、高效获取三维可交互区域的新思路。
2025-04-10 16:59
谷歌发布了其最新AI加速器产品——第七代张量处理单元(TPU)Ironwood,展示了其在AI领域的最新进展和突破。这款AI芯片在性能上超越了全球最快的超级计算机El Capitan的1.7 eflops AI算力,达到了42.5 exaflops的AI算力,是Trillium的六倍。此外,Ironwood还支持推理优化,能够提供生成式AI的下一阶段所需的计算和通信需求。 谷歌副总裁兼机器学习、系统和云 AI总经理Amin Vahdat表示,Ironwood旨在支持生成式AI的“推理时代”,使AI代理能够主动检索和生成数据,以协作方式提供洞察和答案。这一突破意味着AI将不再仅仅依赖于训练和推理工作负载,而是能够更高效地处理复杂的多模态任务。 谷歌还推出了智能体协作协议A2A,旨在促进不同AI智能体的互操作性,简化复杂工作流程中的智能体协作。A2A协议允许跨平台、跨框架的智能体实现互操作,为它们提供了共同的「语言」和安全的通信渠道。 谷歌强调了A2A的开放性,将其作为智能体相互协作的标准方式,不受底层技术框架或服务供应商的限制。谷歌表示,在与合作伙伴设计协议时,坚持了以下五项关键原则:拥抱智能体能力、基于现有标准构建、默认安全、支持长时间运行的任务以及模态无关。 谷歌的这些新进展和创新不仅展示了其在AI硬件和软件方面的领先地位,也为未来的AI应用和开发提供了新的可能。
2025-04-10 16:59
这篇文章主要介绍了阿里云在AI基础设施方面的最新进展,包括FlashMoE混合专家模型、PAI-DLC云原生分布式深度学习训练平台、以及针对大规模MoE和推理模型的优化。文章强调了AI范式正在向MoE和推理模型演进,并指出阿里云已经在解决这些挑战方面取得了重大进展。 文章还提到了阿里云在算力、安全和存储技术方面的持续创新,以及其在智能时代数据库方面的革新。阿里云的目标是通过其强大的AI基础设施,为全球用户提供高效、稳定的计算资源,支持AI的大规模应用和普及。 总的来说,这篇文章展示了阿里云在AI基础设施领域的领先地位,以及其对未来智能时代的承诺和准备。
2025-04-10 16:59
OpenAI 发布了新图像生成器,引发公众争议。CEO Sam Altman 回应批评,强调技术普及带来的好处,但遭到部分用户和评论家的质疑,认为其言论缺乏深度和创新意识。
2025-04-10 16:59
商汤科技最新发布的日日新V6大模型,在多模态AI领域实现重大突破,并计划于明日起开放API。该模型不仅提升了跨模态任务的理解与生成能力,还对标国际顶尖模型,展现出强大的竞争力。此外,API的开放将有助于开发者构建多样化应用,推动AI技术的广泛应用和数字化转型。
2025-04-10 16:58
字节跳动的豆包大模型团队推出了首个多语言软件工程(SWE)数据集——Multi-SWE-bench,旨在提升大模型在自动修复代码错误方面的能力。该数据集覆盖了 Python、Java、Go、Rust、C、C++、TypeScript 和 JavaScript 等七种主流编程语言,实现了全栈工程的评测基准。构建过程包括1632个真实的编程实例,经过严格的测试标准和专业审核,确保每个样本都有清晰的问题描述、有效的修复补丁和可复现的测试环境。这一新数据集不仅有助于开发者节省时间,还能提升软件开发的效率和质量。
2025-04-10 16:58
,Tessell公司近日完成6000万美元融资,由WestBridge Capital领投。该公司计划利用这笔资金扩展市场覆盖并推出基于人工智能的对话式数据库管理服务,以应对企业数据管理和存储的挑战。Tessell的高性能和低成本解决方案将兼容四大主要云服务提供商,包括AWS、谷歌云、微软Azure和Oracle云,以及主流数据库引擎如MySQL、Oracle、SQL Server等。此次融资还吸引了Lightspeed Venture Partners的支持,帮助Tessell开发其人工智能驱动的对话式技术,进一步简化数据管理。
2025-04-10 16:58
西湖大学郭天南团队在《Cell Research》杂志上发表的论文《Grow AI virtual cells: three data pillars and closed-loop learning》揭示了人工智能虚拟细胞(AIVC)的发展,特别是在培养基、细胞类型选择和数据支柱方面的关键发现。该研究通过集成人工智能和多模态数据,创建了精确且可扩展的计算机实验模型,为生命科学领域提供了重要的技术突破。 首先,团队提出了三个数据支柱:先验知识、静态架构和动态状态,这些数据支柱与深度学习算法相结合,构成了AIVC开发的基础。先验知识支柱封装了对模型构建至关重要的基本细胞生物学机制,而静态架构则集成了纳米级分子结构和来自分子建模等高分辨率成像方法的空间分辨数据。最后,动态状态作为第三个支柱,引入了自然过程如衰老、发育和致癌作用以及物理、化学和遗传干预,以构建实时的AIVC。 为了弥补生命系统动态性质上的缺陷,团队引入了动态状态作为AIVC开发的第三个支柱,以此来构建实时的AIVC。这些数据包括自然过程,如衰老、发育和致癌作用,以及包括物理、化学和遗传干预在内的诱发扰动。随着转录组学、蛋白质组学和代谢组学等高通量组学技术的进步,现在可以分析不同细胞状态下的数千种分子。为了构建有效的AIVC,必须全面捕获广泛的细胞状态并最大限度地提高它们的多样性,以确保高精度区分它们,这需要大量的动态细胞特异性数据。 闭环主动学习系统是团队从静态、数据驱动的模型过渡到能够发展智能自适应系统的关键。这一愿景的核心是建立闭环框架,将计算预测与机器人实验相结合,特别是针对动态状态数据中的差距。团队新提出的闭环主动学习系统可以根据它们减少模型不确定性或揭示新调控机制的潜力,优先考虑高影响扰动。随着实验循环进行,虚拟细胞得以不断进化,趋近于真实细胞乃至获得全新的特性。 未来,AIVCs有望在药物开发、疾病建模和基础生物学研究中发挥重要作用。后续系统将在AI预测与机器人实验中进行针对性设计,完善对细胞的理解。科学界的努力将会助力释放AIVC的全部潜力。
2025-04-10 14:58
2025-04-10 14:58