嘿咯AI新闻

贾佳亚团队提出MoTCoder,一种创新的模块化思维指令微调方法,显著提升了大模型在复杂编程任务中的准确率与可维护性。通过创新的模块化思维指令微调(MoT Instruction Tuning),实验显示,在权威编程基准上,MoTCoder的pass@1准确率直接刷新记录,甚至超越SOTA 6%,让大模型在“疯狂打码”时更接近人类智慧。 MoTCoder通过模块化思维对复杂逻辑的拆解能力,将复杂任务拆分成标准化模块,如输入解析、核心算法、异常处理等,像乐高积木般严丝合缝组装,每个模块还自带说明书。这种设计使生成的代码结构更清晰、逻辑更简明,同时保持了更低的复杂度、更精简的代码量和更合理的注释比例。 此外,MoTCoder还具备智能调度功能,根据问题复杂度自动切换极简模式或乐高模式,有效应对不同难度级别的编程任务。实验数据显示,MoTCoder生成的代码具有更低的内存消耗和更高的可维护性指数,显著优于传统模型。 总之,MoTCoder不仅提高了大模型在复杂编程任务中的准确率和可维护性,还为智能编程领域带来了新的突破,重新定义了智能编程的概念。

2025-04-03 12:28

Yann LeCun, 谢赛宁等新作,视觉SSL终于追上了CLIP! 在最新的研究中,Yann LeCun、谢赛宁等人展示了一个重大突破:扩展无语言的视觉表征学习。他们通过与最先进的CLIP模型在同一规模的数据上进行比较,证明了视觉自监督学习(SSL)模型在VQA任务上已经能够达到与语言预训练模型相当的性能。这一成果不仅对计算机视觉领域具有重要意义,也为未来的研究提供了新的方向和可能性。 ### 技术亮点 - **数据规模的扩展**:研究者将数据集的规模从10亿扩大到十亿级图像,并使用开放式VQA任务评估视觉模型。 - **模型大小的增加**:研究者将模型大小从1B增加到7B,同时固定训练数据为20亿张MC-2B图像。 - **性能提升**:随着模型大小的增加,无论是通用还是知识类别的VQA性能都呈现对数线性提升,而OCR & Chart类别的性能则显著提高。 - **高分辨率适应性**:研究者还探讨了在高分辨率下模型性能的变化,发现Web-SSL在384分辨率下表现不佳,但在518分辨率下有显著提升。 ### 实际应用 这种技术的进展不仅提升了视觉SLAM模型在VQA任务上的表现,也为未来更广泛的应用提供了可能。例如,在自动驾驶、机器人导航等领域,需要处理大量的视觉信息,而传统的深度学习方法往往需要大量的标注数据。通过引入无监督的视觉表征学习,可以大幅减少这些领域的数据需求,从而推动相关技术的发展和应用。 ### 结论 Yann LeCun、谢赛宁等人的研究不仅在技术上取得了突破,也为未来的研究方向提供了明确的指导。他们的工作表明,通过无监督的视觉表征学习,我们可以在不依赖大量标注数据的情况下,实现深度学习模型的性能提升。这将为计算机视觉、人工智能等领域带来新的发展机遇。

2025-04-03 12:27

Meta公司正在开发一款名为“Hypernova”的高端智能眼镜,预计今年年底上市。这款眼镜将配备内置屏幕和高级摄像头,支持运行应用程序和显示照片,用户可通过手势和镜框两侧的电容式触摸进行控制。与当前版本的雷朋Meta智能眼镜相比,Hypernova将配备更为先进的摄像头,并继续发展将AI聊天机器人集成到眼镜中的功能。在定价方面,Hypernova的售价将超过1,000美元,最高可能达到1,300至1,400美元,远高于目前299美元起的雷朋Meta智能眼镜。此外,Hypernova还将保留Orion项目的"神经"腕带控制器(代号"Ceres"),以实现更高级的增强现实体验。

2025-04-03 12:27

ChatGPT更新了图片生成功能,包括草书在内的多种字体,准确率高。模型细节渲染、色彩协调性及复杂指令理解能力均有提升。新版提示词测试效果良好,能生成符合要求的图像。用户可使用选区工具进行特定区域编辑,提高创作灵活性。

2025-04-03 12:27

Sensor Tower发布了2024年全球移动发行商收入TOP50榜单,显示全球消费者在移动应用市场的付费总额首次突破1500亿美元,同比增长达13%。腾讯以绝对优势稳居第一,得益于其在游戏、社交及其他领域的全生态布局。字节跳动以TikTok的生态及全球化战略位列第二。OpenAI首次进入全球TOP50,位列第46名,显示其在用户分析、内容生成及个性化推荐等领域的进步。多邻国(Duolingo)也表现不俗,排名第38。混合休闲游戏的兴起为传统游戏领域带来了创新。Scopely和Dream Games分别通过多元化的产品矩阵和创新消除类游戏展现了中小厂商在全球市场的潜力。

2025-04-03 12:27

百度发布飞桨框架3.0,助力大模型时代的智能开发。该版本引入了“动静统一自动并行”技术,显著降低大模型开发成本,并支持高性能推理。同时,通过训推一体设计理念,有效打破训练与推理壁垒。在科学智能领域,飞桨框架3.0提升微分方程求解速度,适配主流开源科学计算工具,拓展应用价值。运算性能方面,通过自研神经网络编译器CINN提升4倍运行速度,超过60%的模型表现出显著性能提升。此外,飞桨框架3.0推出多芯片统一适配方案,构建全栈部署生态体系,目前已服务43万家企业,创建101万个模型。开发者可使用兼容2.0版本的开发接口,享受更多便利。

2025-04-03 12:27

OpenAI呼吁英国制定前瞻性版权政策以推动人工智能发展,强调数据和文本挖掘例外的重要性,以促进创新和投资。

2025-04-03 12:27

OpenAI 通过GPT-4o技术实现了显著的收入增长,仅3个月就从3.33亿美元增至4.15亿美元。其ChatGPT用户数突破2000万,付费用户数量也飙升至2000万人。此外,GPT-4o还被用于制作治愈系新闻插画,如将日常视频转化为吉卜力风格,引发网友共鸣。这种技术的应用不仅丰富了内容形式,也为AI在媒体和娱乐领域的应用开辟了新途径。

2025-04-03 10:27

OpenAI 成立了新委员会,旨在助力构建最强大的非营利组织。该委员会将通过收集来自健康、科学、教育和公共服务领域的领导者和社区反馈,帮助慈善部门理解面临的紧迫问题,并在四月公布成员名单。董事会将考虑这些见解,以推进 OpenAI 的非营利工作,并计划在2025年底前取得实质性进展。

2025-04-03 10:27

OpenAI推出名为PaperBench的AI代理评测基准,旨在评估AI代理复制先进AI研究的能力。该测试要求AI代理从头开始复制20篇2024年国际机器学习会议(ICML)中的重点和口头论文,整个过程涉及理解论文贡献、开发代码库以及成功执行实验。为了实现大规模评估,研究团队还开发了一种基于大型语言模型(LLM)的自动评分系统。在对多个前沿AI模型进行评测后,研究发现表现最佳的代理是Claude3.5Sonnet(新版本),其平均复制得分为21.0%。为了推动后续研究,OpenAI团队决定将其开发的代码开源。

2025-04-03 10:27