大模型 - AI学习站

百度发布飞桨框架3.0，助力大模型时代的智能开发

4月3日，百度正式推出了飞桨框架3.0版。这一全新版本在设计理念上实现了全面进化，特别针对大模型的开发和推理需求，提供了五大核心特性，力求成为深度学习框架领域的领先者。随着大模型在各行各业的广泛应用，深度学习框架的作用愈发重要，而飞桨框架3.0正是为此而生。首先，飞桨框架引入了 “动静统一自动并行” 技术，显著降低了大模型的开发和训练成本，让算法创新更专注于核心价值的创造。此外，它的 “训推一体”

AI热点 3月前 0 点赞 0 评论 85 浏览

粉笔AI荣获中国AIGC产业峰会2025值得关注AIGC产品奖

在近日举行的第三届中国 AIGC 产业峰会上，粉笔 AI 凭借其在职业教育领域的突出表现，荣获 “2025年值得关注的 AIGC 企业” 和 “2025年值得关注的 AIGC 产品” 两项大奖。此次峰会由量子位主办，主题为 “万物皆可 AI”，吸引了众多科技和教育行业的专家和从业者。粉笔的 CTO 陈建华在峰会上发表了题为《智能教育的重塑与实践:大模型的落地之路》的演讲。他深入探讨了大模型技术在教

AI热点 3月前 0 点赞 0 评论 216 浏览

媲美OpenAI-o3，刚刚开源模型DeepCoder，训练方法、数据集大公开

声明:本文来自于微信公众号 AIGC开放社区，作者:AIGC开放社区，授权站长之家转载发布。今天凌晨4点，著名大模型训练平台Together AI和智能体平台Agentica，联合开源了新模型DeepCoder-14B-Preview。该模型只有140亿参数，但在知名代码测试平台LiveCodeBench的测试分为60.6%，高于OpenAI的o1模型（59.5%），略低于o3-mini(60

AI热点 3月前 0 点赞 0 评论 157 浏览

学术打假！清华上交大研究颠覆认知：强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文，对业界普遍认为"纯强化学习（RL）能提升大模型推理能力"的观点提出了挑战性反驳。研究发现，引入强化学习的模型在某些任务中的表现，反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中，RL模型在低采样次数（k值）下准确率提升，但在高k值时问题覆盖

AI热点 2月前 0 点赞 0 评论 195 浏览

飞桨3.0正式发布，支持文心4.5等大模型，跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新，包括“动静统一自动并行”等关键技术，旨在有效降低大模型开发和训练成本，助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施，飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型，并通过优化的DeepSeek-R1满血版单机部署，

AI热点 3月前 0 点赞 0 评论 203 浏览

智谱AI正式启动IPO辅导，力争成为A股首家大模型公司

近日，北京智谱华章科技股份有限公司（简称 “智谱 AI”）向北京证监局递交了首次公开发行股票(IPO)辅导备案，成为首个启动 IPO 的 “大模型六小虎” 企业。如果一切顺利，智谱 AI 有望成为中国 A 股市场上的第一家 “大模型” 上市公司。智谱 AI 成立于2019年，起源于清华大学计算机系的技术成果转化。自创立以来，该公司凭借强大的技术实力和团队背景，迅速获得投资者的关注，成为行业内的佼

AI热点 3月前 0 点赞 0 评论 112 浏览

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划

4月14日，在北京举办的2025商汤技术交流日上，商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者，商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务，以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级，旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及

AI热点 3月前 0 点赞 0 评论 208 浏览

迅雷全新升级：一键下载大模型，轻松畅享加速体验！

在人工智能技术飞速发展的今天，开发者们常常需要下载庞大的模型文件。然而，传统的单文件逐一下载方式不仅费时费力，而且完成大量下载后，杂乱无章的文件整理常常让人感到焦头烂额。为了解决这一问题，迅雷近期推出了全新版本的插件，针对大模型下载进行了全面升级，带来了 “自动加载全量文件、智能归档、一键下载” 的全新体验。升级后的 “一键下载” 功能，旨在极大地提升下载效率，帮助用户更快捷、更高效地获取大模型文

AI热点 3月前 0 点赞 0 评论 129 浏览

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

声明：本文来自微信公众号“量子位”，作者:克雷西，授权站长之家转载发布。上线仅三天的神秘模型，已经鲨疯了!大模型聚合平台OpenRouter新推出的Optimus Alpha，已经处理了772亿Token，平均每天超过200亿。并且这个数字还在上升，日Token处理已超过340亿，排名第二，并在Trending榜单上位列第一。有网友试着用它挑战MC-Bench，生成《我的世界》风格的场景，并对

AI热点 3月前 0 点赞 0 评论 167 浏览

Llama 4大模型跌落神坛：作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

4月8日消息，被寄予厚望的美国Meta公司的最新开源大模型Llama 4发布不到2天时间，口碑急转直下，被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。今天，大模型评测平台LM Arena亲自下场发文，打脸Meta提供给平台的Llama 4是“特供版”。据知情人士爆料称，Meta因面临DeepSeek、Gemini等竞品的快速迭代压力，选择“仓促发布未完成优化的模型”，牺牲技术严谨

AI热点 3月前 0 点赞 0 评论 200 浏览

大模型

首页

大模型

列表

默认

浏览次数

发布日期