《Science子刊》发表的论文《FairDiffusion: Enhancing Equity in Latent Diffusion Models via Fair Bayesian Perturbation》首次提出了一种基于公平贝叶斯扰动的医学图像生成方法,旨在解决模型在生成过程中对不同人群(性别、种族、族裔)的不公平问题。该方法通过引入自适应高斯扰动来缩小群体间的误差差距,并设计了新的公平性评价指标,如ES-FID和ES-IS,以量化各群体间的公平性。此外,该研究还构建了一个名为FairGenMed的数据集,用于评估其方法的有效性。 研究结果显示,FairDiffusion在多个医学影像数据集上均取得了显著的性能提升,特别是在图像清晰度和细节表现上,尤其是在弱势群体样本上的优势更为明显。此外,通过对比实验,证明了该方法在整体图像质量和各群体间公平性的双重提升效果。未来,研究团队将继续扩充数据集规模、丰富敏感属性维度,并探索更多应用场景下的公平生成策略,以推动医学生成模型在全球医疗影像领域实现更为普惠、公正的应用。
2025-04-12 19:10
新加坡国立大学LinS Lab的邵林团队开发了一种名为DexSinGrasp的强化学习算法,旨在提高机器人在复杂环境中抓取物体的能力。这项技术通过整合物体分离与抓取任务,使灵巧手在杂乱环境中能够自适应调整策略,显著提高了抓取成功率和操作效率。 研究团队提出了一种基于强化学习的统一策略,该策略通过融合物体分离与抓取动作,实现了「分离—抓取」动作的无缝衔接。该方法引入了分离奖励项,将「分离障碍」、「抓取目标」整合为一个连续的动作决策过程,避免了传统多阶段方法中各模块间效率低下和动作衔接不畅的问题。此外,研究还设计了一套多难度抓取任务,通过大量实验验证了所提方法的高效性与有效性。 为了解决机器人在多变的杂乱环境中高效分离物体并抓取目标的问题,DexSinGrasp 提出了「统一策略」的设计。该方法通过强化学习构建了一体化的策略框架,实现了「分离—抓取」动作的无缝衔接。该项研究的主要贡献有: - 统一强化学习策略:提出一种统一的强化学习策略,实现灵巧手在杂乱环境中对物体的有效分离和抓取。 - 课程学习与策略蒸馏:融入杂乱环境课程学习以提升不同场景下的策略性能,并通过策略蒸馏获得适用于实际部署的视觉抓取策略。 - 多难度抓取任务设计:设计一系列不同难度与排列的杂乱抓取任务,通过大量实验验证所提方法的高效性与有效性。 此外,研究团队还在实机平台上进行了验证。使用 uFactory xArm6 搭载 LEAP 手,并配备两台 Realsense RGB-D 摄像头以进行实时点云数据融合与滤波处理。图示为实机实验中对密集与随机摆放的 4、6、8 个物体场景下成功分离与抓取的演示。实验表明,经过教师—学生策略蒸馏后的视觉策略在实际操作中也能有效完成杂乱环境的有效分离与抓取。 总之,DexSinGrasp 是一种基于强化学习的统一框架,通过整合物体分离与抓取任务,实现了灵巧手在杂乱环境中的高效操作。该方法突破以往直接抓取或多阶段分割的策略,利用推移、滑动等动作在抓取过程中直接调整障碍物布局,结合环境复杂度递进式的杂乱环境课程学习与教师—学生策略蒸馏技术,有效提升视觉策略
2025-04-12 17:09
这篇文章由法国索邦大学、苹果的研究者共同撰写,主要研究了多模态模型(NMM)在处理不同数据类型时的性能和效率。文章指出,尽管传统的深度学习模型如长短期记忆网络(LSTM)在处理多模态数据时表现良好,但它们通常需要大量的参数和计算资源,这限制了它们的应用范围。因此,研究人员提出了原生多模态模型(NMM),这是一种不需要额外编码器层即可处理多种模态数据的模型。 研究表明,早融合架构在低参数数量下表现出更强的性能,训练效率更高,并且更易于部署。此外,通过结合混合专家(MoE),NMM 可以学习特定于模态的权重,从而显著提升性能。 论文还比较了NMM与纯文本语言模型(LLM)的Scaling Laws,发现两者遵循相似的规律,但NMM 在计算预算较低的情况下仍能保持较好的性能。此外,研究还探讨了后融合和早融合模型之间的权衡,指出后融合模型需要更多的参数,而早融合模型则受益于更多的训练 token。 最后,文章总结了多模态模型的研究进展,并强调了在统一架构内进行多模态特化的重要性。
2025-04-12 17:09
这篇文章主要讨论了人工智能(AI)领域的进展,特别是关于数据源和数据利用方式的变革。文章指出,尽管深度学习、Transformer模型、RLHF和推理等技术已经取得了巨大的进步,但AI领域的进步并没有停滞不前,而是持续进行中。作者认为,下一个重大突破可能来自新的数据源,如视频数据和实体世界数据。 此外,文章还提到了一些研究人员正在探索如何更好地利用现有数据,例如通过改进现有的训练方法或开发新的训练策略来提高模型的性能。这些研究可能会带来新的技术突破,从而推动AI领域的进一步发展。 总的来说,这篇文章强调了数据在AI发展中的重要性,并提出了新的研究方向,即如何从新的数据源中学习并提高模型的性能。
2025-04-12 17:09
AI技术在游戏和娱乐领域的应用正日益增多,特别是在《我的世界》这样的沙盒游戏中。本文介绍了一种名为AssistanceZero的新算法,它通过扩展AlphaZero来分离预测和行动,从而在与人类玩家的互动中取得更好的效果。这项技术不仅提高了AI助手的能力,还解决了以往AI助手在复杂环境中表现不佳的问题。此外,研究团队还开发了一种新的基于奖励的人类模型,以更好地模拟真实世界中人类的决策过程。这些进展为AI在游戏和娱乐领域的应用提供了新的思路和方法。
2025-04-12 17:09
华为云在2025年4月10日-11日的华为云生态大会上发布了多项AI技术产品,包括昇腾AI云服务、软件开发生产线CodeArts、数字内容生产线MetaStudio等。这些产品全面升级了AI基础设施,提供了强大的算力和智能工具链,以应对大模型时代的需求。 华为云基于全栈系统性创新能力,重构了AI基础设施,并推出了基于新型高速总线架构CloudMatrix 384超节点集群的新一代昇腾AI云服务。这一服务提供超大规模、性能卓越、稳定可靠的AI算力集群,满足了复杂大模型训练、推理需求。 华为云还全面升级了GaussDB数据库,以满足企业在AI时代下的数据管理要求。通过原生分布式性能再提升50%,提供PB级数据管理能力,在线扩容速度提升10倍,并推出了AI加持的数据库智能助手。 华为云安全服务产品部部长左文树介绍了完善的云原生安全体系,包括一个中心和七层防线,实现了攻击不瘫、数据不丢、监管合规。 华为云PaaS服务产品部部长徐峰展示了CodeArts智能升级体验,端到端研发效率提升30%。此外,华为云还推出了MetaStudio数字内容生产线,升级智能交互数字人,集成更加聪明的大模型脑袋,实现多模态、拟人化、高精准的智能交互。 华为云还打造了战略级产品CloudDevice,通过云侧无限算力+存力+电力+运力实现有竞争力的算力服务,具备60ms端云极低时延、普惠AI入口、多屏无缝流转的优势。 昇腾AI云服务已全面适配行业主流160多个大模型,服务六百多家的创新先锋企业。其中,DeepSeek系列模型也已上线昇腾AI云服务,基于昇腾AI云服务的全栈优化适配,可获得持平全球高端GPU部署模型的效果。 华为云昇腾 AI 云服务提供全链路 DeepSeek 专业服务体系,涵盖咨询、部署实施、场景开发微调、蒸馏模型开发、大模型开发增量预训练及培训六大类服务场景和30多个服务能力。 华为云还推出了Flexus企业大模型应用解决方案,大幅度提升了大模型应用的可靠性和体验,并且通过Solution as Code实现场景化解决方案的一键部署,大幅降低了
2025-04-12 11:08
OpenAI宣布GPT-4将退役,标志着AI大模型时代的新篇章。GPT-4自2023年发布以来,以其强大的语言理解和生成能力迅速席卷全球,推动了教育、编程、内容创作等多个领域的革命性变革。然而,随着GPT-4o的全面超越,其退役仅限于ChatGPT平台,但OpenAI在产品策略上聚焦于整合更先进的模型,为用户提供统一的优质体验。此外,社交媒体上频繁出现的高频迭代不仅推动了技术进步,也让用户感受到时间的“压缩”。未来,随着新模型的推出和GPT-5的发布,AI将在个性化、效率和创造力上为用户带来更多惊喜。
2025-04-12 11:08
谷歌正在开发名为“Circle Screen”的新功能,旨在提升用户在Gemini AI平台上的搜索体验。该功能允许用户通过圈选屏幕特定区域进行精准搜索,与安卓旗舰手机的“Circle to Search”功能相似但更专注于特定对象。这一改进将提高操作便捷性并增强用户体验。目前,该功能处于内部测试阶段,尚未公开推出。
2025-04-12 11:08
ChatGPT在2025年3月全球非游戏类应用下载量中突破4600万次,超越Instagram和TikTok成为最受欢迎应用。这一成就主要得益于其图像生成功能,该功能迅速吸引用户并引发社交媒体热潮。这一数据表明AI技术在数字应用市场具有巨大潜力,未来可能更多向AI和个性化服务倾斜。
2025-04-12 11:08
斯坦福大学人工智能研究所发布的《2025年人工智能指数报告》显示,阿里巴巴在全球AI大模型贡献中排名第三,仅次于谷歌和OpenAI。阿里的“通义千问”系列模型在多个基准测试中表现出色,其训练数据量达到18万亿tokens,超过竞争对手Llama-405B的15万亿tokens。此外,阿里巴巴计划未来三年投入3800亿元人民币用于AI和云计算的发展,以提升基础模型的研发和推动相关应用转型。
2025-04-12 11:07