嘿咯AI新闻

标题:字节跳动发布新推理模型 Seed-Thinking-v1.5,性能超越DeepSeed-R1 摘要: 字节跳动今日宣布推出其最新推理模型 Seed-Thinking-v1.5。该模型在多个权威基准测试中表现卓越,超越了拥有671B参数的DeepSeed-R1模型。Seed-Thinking-v1.5在AIME 2024测试中获得86.7分,Codeforces评测达到55.0分,GPQA测试得分为77.3分,展示了其在STEM(科学、技术、工程和数学)领域的出色推理能力。此外,该模型在非推理任务上也显示出显著的泛化能力,用户反馈积极。 关键词: 字节跳动;深度学习;推理模型;Seed-Thinking-v1.5;性能超越;AIME 2024;Codeforces;GPQA 正文: 近日,字节跳动公司发布了其最新的推理模型 Seed-Thinking-v1.5。这一模型在多个权威基准测试中的表现令人瞩目,特别是在与DeepSeed-R1模型的对比中,Seed-Thinking-v1.5展现出了卓越的性能。 AIME 2024测试中,Seed-Thinking-v1.5获得了86.7分的高分,这一成绩超过了DeepSeed-R1模型的79.3分。在Codeforces评测中,该模型同样表现出色,得分达到了55.0分,这一分数接近于DeepSeed-R1模型的55.0分。而在GPQA测试中,Seed-Thinking-v1.5的得分更是高达77.3分,这显示了其在STEM领域的强大推理能力。 除了在基准测试中的表现,Seed-Thinking-v1.5在非推理任务上的表现也相当出色。用户反馈显示,该模型在处理各种复杂场景时都能提供准确的答案,尤其是在解决实际问题方面的能力得到了用户的高度评价。 这一成就的背后,是字节跳动团队在数据、强化学习算法以及基础设施等多个方面的创新和努力。他们通过整合STEM问题、代码任务、逻辑推理和非推理数据,为模型的训练提供了丰富的素材。同时,他们还引入了先进的强化学习算法和奖励机制,确保模型

2025-04-11 13:04

美国司法部周三指控AI购物应用Nate创始人阿尔伯特·萨尼格(Albert Saniger)欺诈投资者,声称其应用通过AI技术实现一键购物,但实际依赖人工操作。Nate成立于2018年,曾从多家机构筹集资金,包括Renegade Partners的3800万美元A轮融资。然而,美国司法部调查发现,尽管公司获得了一些AI技术并聘请了数据科学家,其应用程序的实际自动化率为0%。Nate大量使用人类承包商的行为曾在2022年成为The Information调查的对象。目前,Nate创始人阿尔伯特·萨尼格不再担任CEO,而是成为纽约风投公司Buttercore Partners的执行合伙人。

2025-04-11 13:03

苏宁易购在Max店引入了灵思店员AI助手和数字人导购屏系统,通过融合AI技术和DeepSeek技术,建立了双引擎智能服务体系。该系统提高了门店运营效率、用户服务体验和营销转化效果。店员现在只需输入关键词即可获取精准信息,处理问题时间缩短至1分钟/件,准确率提高至98%以上。同时,智能数字人导购屏将“灵思零售大模型技术”与实体零售场景紧密结合,形成了数字化服务闭环。这些数字化产品增强了顾客信任,提升了门店运营和服务品质。未来,公司还计划推出更多智能管理工具,推动零售行业智能化升级。

2025-04-11 13:03

丰田汽车与AI安全与网络智能提供商Gorilla合作,共同开发智能仓库自动化工具。此举旨在解决日常运营中的实际问题,如“错误的零件请求、仓库效率低下和高昂的工作延误成本”,将智能技术引入仓库环境。新系统将在泰国推出,计划在验证有效性后全球推广,支持丰田的数字化转型战略。Gorilla的AI工具涵盖多个领域,致力于提高仓储和物流的效率与安全性。

2025-04-11 13:03

硅光子初创公司nEye Systems Inc.宣布完成5800万美元B轮融资,由谷歌母公司Alphabet领投,微软、Micron Ventures、英伟达和Socratic Partners等参与。此轮融资使nEye总融资额超过7200万美元,此前已进行种子轮融资。nEye专注于开发利用光学技术通过光而非电信号传输数据的芯片级光学电路交换技术,旨在解决现代数据中心多依赖基于电信号连接方式的带宽限制和高能耗问题。其技术能实现几乎无限带宽的数据传输,能效高1000倍,速度快10000倍,成本低10倍。nEye的联合创始人吴明教授表示,谷歌在这一领域是先行者,AI公司和大型数据中心运营商更愿意购买而非自己研发这项技术。

2025-04-11 13:03

Vector Institute 发布了 AI 模型性能评估报告,旨在提高模型的透明度和可信度。该报告通过11个顶尖模型的全面评测,涵盖数学、通用知识、编码等多个领域,并引入了多模态巨量多任务理解(MMMU)基准。研究发现,闭源模型在复杂任务中表现优于开放源代码模型,但仍需解决多模态理解和动态评估的挑战。

2025-04-11 13:03

川崎重工在2025年大阪世博会上展出的Corleo四足机器人,融合了《地平线:零之曙光》中的机甲元素和《幽灵公主》中的山兽神设计,展示了日本在AI技术方面的领先。这款机器人不仅具有强大的越野能力,还具备高度智能化和自主性,预示着未来交通工具的革命性变化。

2025-04-11 11:03

千寻位置发布了机器人时空智能三体开发套件SpatiX,旨在降低研发门槛和提升效率,加速具身机器人在全域全场景的应用。该套件包括时空智能服务、模组/板卡/定制天线及整机盒子,并提供了大气推理大模型、电离层感知大模型等专为机器人行业定制的特色服务。随着2025年政府工作报告将具身智能写入未来产业体系,机器人正从封闭式专用系统向通用化智能平台转型,对全域全场景的时空智能能力提出了迫切需求。千寻位置CEO陈金培指出,时空智能是实现物理世界与数字世界高效协同的关键桥梁。通过北斗时空智能技术,机器人能够在室内外一体化环境中输出精准、可靠且安全的位置信息,完成复杂任务。千寻位置还基于巡检视觉大模型为机器人提供高效识别破损设施、可疑问题或人员异常闯入等功能。此次推出的时空智能三体套件是千寻位置“星地一体、云芯一体、软硬一体”的三体技术能力在机器人领域的创新实践。

2025-04-11 11:03

趣丸千音,一款领先的国产语音工具,在AI技术领域取得了显著成就。其核心功能包括视频翻译、文本转语音和有声书制作,均展现出高情商和卓越的中文处理能力。特别是其视频翻译服务,通过一站式Agent工作流实现自动化字幕擦除、翻译、配音、后期制作及成片交付,单次批量上传最大支持40G,颠覆了全球化内容生产的传统模式。此外,文本转语音技术允许用户输入文本即配音,自动识别多种语言并调整语速和音色,满足复杂场景的精细化需求。最后,趣丸千音的有声书功能也展现了其强大的生产能力,能够自动生成具有情感表现力的有声读物,使每个故事和角色栩栩如生。

2025-04-11 11:03

谷歌发布69页白皮书,系统阐述提示工程核心理念与最佳实践。文档为开发者、研究人员提供全面指导,旨在优化AI模型交互效果,提升生成内容质量与精准度。内容包括提示工程演变历程、多种提示技术解析及最佳实践指南。该白皮书不仅为提示工程领域提供权威参考,也推动AI技术普及与规范化。未来,提示工程可能进一步与自动化工具结合,降低技术门槛,为AI应用创新注入新动力。

2025-04-11 11:03