亚马逊推出革命性 AI 语音模型 Nova Sonic,价格更具竞争力!

亚马逊近日发布了其最新的 AI 语音模型 ——Nova Sonic,这一新技术标志着该公司在人工智能语音领域的重要进展。Nova Sonic 能够快速处理语音输入并生成自然流畅的语音输出,其在速度、识别准确性以及对话质量等方面已达到了与 OpenAI 和谷歌等行业领军企业的顶尖水平。与其他 AI 语音模型相比,Nova Sonic 在性价比方面表现突出,价格竟然比 OpenAI 的 GPT-4o

生成很强,推理很弱:GPT-4o的视觉短板

声明:本文来自微信公众号“大数据文摘”(ID:BigDataDigest),作者:文摘菌,授权站长之家转载发布。如果让AI画一只狗站在“左边”,但事先告诉它“左就是右”,你觉得它能反应过来吗?最近,UCLA的一项新研究用一系列精心设计的实验,揭开了GPT-4o在图像理解和推理上的短板——它画得漂亮,却未必真懂你的意思。论文主线很直接,GPT-4o的画图能力确实惊艳,但真正涉及理解图像、语境推理

阿里AI模型获FDA认定“突破性医疗器械”

近日,阿里巴巴的 AI 模型 DAMO PANDA 获得了美国食品和药物管理局(FDA)的 “突破性医疗器械” 认证。这一成就标志着阿里巴巴在胰腺癌早期筛查领域取得了重大突破,为该疾病的早期诊断提供了新的可能性。DAMO PANDA 是阿里巴巴达摩院研发的一款专注于胰腺癌筛查的 AI 模型。其主要功能是通过分析平扫 CT 影像,精准识别出人眼难以察觉的细微病灶。这项技术的推出,旨在解决胰腺癌早期筛

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM,让小模型超越 GPT-4o

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。传统的过程奖励模型(PR

华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream 7B,打破文本生成格局

人工智能领域再添一颗耀眼新星!近日,华为诺亚方舟实验室与香港大学自然语言处理组(HKU NLP Group) 联合发布了名为 Dream7B 的全新语言模型。这款模型被誉为“迄今为止最强大的开源扩散大型语言模型”。Dream7B 的问世,不仅在性能上超越了现有的扩散语言模型,更在通用能力、数学、代码以及规划能力上,比肩甚至超越了同等规模的顶尖自回归(AR)语言模型。这一突破性的进展,预示着文本生成

新框架d1引领扩散模型推理进步,掀起强化学习应用新风潮

在人工智能的不断发展中,扩散模型在推理能力上逐渐崭露头角,现如今,它们不再是自回归模型的 “跟随者”。近日,来自加州大学洛杉矶分校(UCLA)和 Meta 的研究者们联合推出了一种名为 d1的新框架,该框架结合了监督微调(SFT)和强化学习(RL),使扩散模型具备更强的推理能力,包括数学理解、逻辑推理等。这一创新的 d1框架通过两阶段的后训练策略来提升掩码大语言模型(dLLM)的性能。在第一阶段,

斥资36亿!OpenAI考虑收购前苹果设计师AI初创公司

快科技4月8日消息,据报道,OpenAI近期正就收购AI硬件初创公司io Products展开深入谈判,这笔潜在交易或将重塑人工智能硬件市场格局。据知情人士透露,OpenAI高层曾考虑以至少5亿美元(约合人民币36.41亿元)的价格收购这家由OpenAI CEO萨姆阿尔特曼与前苹果传奇设计师乔纳森艾维联合创立的公司。乔纳森艾维作为苹果前首席设计官,曾主导iPhone、MacBook等划时代产品

国产AI崛起!17亿参数开源图像模型HiDream-I1横空出世

当代码的力量遇上艺术的灵感,新一代人工智能正在悄然改变创意世界的边界。近日,国产开源图像生成模型HiDream-I1震撼发布,凭借17亿参数的技术底蕴,这款由HiDream-ai团队倾力打造的AI"画匠"正迅速成为科技圈新宠。这款基于扩散模型技术的开源图像生成工具,能够将文本描述转化为高质量图像,在细节渲染和图像一致性方面展现出令人瞩目的实力。初步测试显示,HiDream-I1在色彩还原、边缘处理

Perplexity 竞技场夺冠,Sonar挑战谷歌Gemini的搜索霸主地位

在最新的 LM Arena Search Arena 评估中,Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异,与谷歌的 Gem-2.5-Pro-Grounding 模型并列第一,直接对决的胜率达到53%。这一消息无疑给搜索引擎领域带来了新的震动,显示了 Perplexity 在 AI 搜索技术上的强大实力。Sonar 系列模型在此次评估中包揽了前四名,

开源新模型 DeepCoder:超高效编程,超越OpenAI o1模型

在科技发展的浪潮中,人工智能(AI)技术日新月异。最近,由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview,吸引了广泛关注。该模型以仅有的140亿参数,在代码测试平台 LiveCodeBench 上的得分为60.6%,超过了 OpenAI 的 o1模型(59.5%),仅略低于 o3-mini(60.9%)。这一