OpenAI 升级 ChatGPT AI 高级语音模式:减少打断、支持暂停思考

IT之家 3 月 25 日消息,科技媒体 NeoWin 今天(3 月 25 日)发布博文,报道称 OpenAI 公司革新 ChatGPT 高级语音模式(Advanced Voice Mode),重点优化对话流畅度。新版本减少不必要的打断,新增暂停功能,并强化付费用户的语音个性表现,该功能已面向全体用户开放,免费版存在使用限额。本次更新修复了此前用户反馈的“意外插话”问题,建议 iPhone 用户

成都:力争今年 AI 核心产业规模 1300 亿元,培育 10 个大模型通过国家备案

IT之家 3 月 26 日消息,IT之家从成都市经信局获悉,成都市人工智能产业链工作专班办公室 3 月 25 日举办“2025 年成都市人工智能与机器人产业发展重点工作媒体吹风会”,并发布《2025 年成都市人工智能产业链发展工作要点》。《工作要点》明确,力争 2025 年成都人工智能核心产业规模达到 1300 亿元、增速超过 30%,加速打造全国人工智能与机器人产业发展高地。聚焦“AI 三要素

诺奖得主罗杰・彭罗斯:人工智能不会有意识,因此不应被视为“智能”

IT之家 3 月 26 日消息,随着生成式 AI 重塑人类对世界和工作的认知,关于 AI 是否会取代人类也一直是个备受瞩目的议题,不少人更预测 AI 未来会“具备意识”。据外媒 Windows Central 今日报道,诺贝尔奖得主、理论物理学家罗杰・彭罗斯爵士(Sir Roger Penrose)对此持不同看法。他指出,AI 无法拥有意识,这一观点基于哥德尔不完备定理(Gödel"s Inco

腾讯自研深度思考模型“混元 T1”正式版上线元宝

感谢IT之家网友 lxylizi 的线索投递!IT之家 3 月 26 日消息,腾讯元宝今日凌晨宣布完成了两大模型升级,同时接入腾讯自研的深度思考模型“混元 T1”正式版和 DeepSeek V3-0324 两个模型。据介绍,腾讯元宝升级后在代码生成、数学推理、长文本处理等方面的能力进一步提升。同时官方表示,元宝是最早一批上线 DeepSeek V3-0324 的 AI 应用,从模型上线到接入仅

Perplexity的成功之道:AI优先策略与灵活组织模式

Perplexity是一家AI搜索公司,成立不到两年,用户数迅速增长至数千万,年经常性收入超过2000万美元,估值超过10亿美元,完成了6300万美元的融资。公司成功的关键在于AI优先策略、小团队运行、技术产品管理、灵活的产品开发、去中心化的决策过程以及对灵活性和主动性人才的重视。Perplexity通过共享指南和流程来并行化项目,采用季度计划保持产品路线图的稳定性和灵活性,鼓励团队成员承担产品

寻光:AI视频创作平台,用PPT制作的方式创作视频,为用户带来一站式、高可控的AIGC创作体验

寻光AI视频创作平台是达摩院推出的一款创新产品,以视觉AIGC为核心功能,让用户通过PPT制作的方式轻松创作视频。该平台提供一站式、高可控的AIGC创作体验,让用户体验到AI创作的魅力。寻光功能视觉AIGC功能:利用先进的人工智能技术,实现视频内容的自动生成和编辑。PPT制作:用户可以通过简单的PPT操作,快速制作出高质量的视频内容。高可控性:用户可以自定义视频风格、字幕、音效等,实

AI 文生图新王者:Reve Image 1.0 登顶,低价高质挑战 Midjourney 和 Flux

IT之家 3 月 27 日消息,科技媒体 WinBuzzer 昨日(3 月 26 日)发布博文,报道称新锐 AI 图像生成工具 Reve Image 1.0 以低价高质为卖点,正式向 MidJourney 和 Flux 发起挑战。该模型以精准理解用户指令、卓越美学表现和文字渲染能力为特色,目前提供免费试用,未来可能会开放 API。第三方测试显示其图像生成质量已超越 Midjourney v6.1

AI “看图说话” 更懂细节!腾讯开源多模态理解技术HaploVL

3月27日,腾讯开源团队宣布推出了一项创新的多模态理解技术——HaploVL。这一技术旨在通过单个Transformer架构实现高效的多模态融合,显著提升AI在视觉和语言交互中的表现,特别是在细粒度视觉理解任务上。在人工智能领域,多模态大模型(LMMs)近年来迅速崛起,它们能够实现复杂的视觉-语言对话和交互。然而,现有的多模态模型大多采用“视觉编码器 + 大语言模型”的组合架构,这种架构虽然有效,

开源模型逆袭:Databricks TAO 技术微调 Llama 超越 GPT-4o

近日,数据智能公司 Databricks 推出了一种全新的大语言模型微调方法 ——TAO(Test-time Adaptive Optimization),这一技术的出现为开源模型的发展带来了新的希望。通过运用无标注数据和强化学习,TAO 不仅在降低企业成本方面表现出色,更是在一系列基准测试中取得了令人瞩目的成绩。根据科技媒体 NeoWin 的报道,TAO 微调后的 Llama3.370B 模型在

谷歌 AI 发布 TxGemma:全新大规模语言模型助力药物开发

药物开发是一个复杂且成本高昂的过程,伴随着高失败率和漫长的开发周期。传统的药物发现过程需要从靶点识别到临床试验的各个阶段进行大量的实验验证,这往往消耗大量的时间和资源。然而,随着计算方法,特别是机器学习和预测建模的兴起,这一过程有望得到优化。为了应对当前计算模型在多种治疗任务中的局限性,谷歌 AI 推出了 TxGemma,这是一个专为药物开发中的各种治疗任务设计的通用大规模语言模型(LLM)系列。

那个利用 AI 通过亚马逊、Meta面试的大学生,被学校开除了!

在此之前,罗伊・李(Roy Lee)开发了一款利用AI帮助自己通过亚马逊、Meta等公司技术面试的工具,他说,他现在被哥伦比亚大学停学了!站长之家(ChinaZ.com) 3月28日 消息:哥伦比亚大学的学生罗伊・李(Roy Lee)称,他在开发了一款AI工具后被学校停学了 —— 这款工具曾帮助他通过了 Meta(原 Facebook)、亚马逊(Amazon)和 TikTok 严苛的技术面试(

AI日报:阿里最新视觉推理模型QVQ-Max;可灵AI上新AI音效功能;GPT-4o升级后性能飙升;Midjourney V7将于下周发布

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴发布最新视觉推理模型 QVQ-Max阿里巴巴旗下的AI研究团队Qwen发布了其最新的视觉推理模型QVQ-Max。该模型能够理解图片和视频,并进行深入分析与推理,应用场

腾讯元宝更新,能读懂 36 种文件

IT之家 3 月 28 日消息,腾讯元宝宣布更新,支持用户上传和解析多达 36 种格式的文件。除了 Word、Excel、PPT、PDF 等常见办公文档,还支持.py、.java、.json 等数十种开发文件格式。在开发场景,只要上传文件,元宝即可识别其中的内容,并按照用户的要求完成代码解读、代码审查、定位 Bug、提供修改建议、优化语法,还可以将代码转换成另一种语言。例如,开发者可以直接上传项

小米轨道插座上新:8000W 高负载、旋转通断电,众筹价 289 元起

感谢IT之家网友 新心思、钢筋混凝土 的线索投递!IT之家 3 月 24 日消息,小米轨道插座今日在小米有品上架,并将于 3 月 26 日开启众筹,提供 50cm 套装、75cm 套装、100cm 套装 3 个版本,众筹价 289 元起。IT之家从商品页面获悉,这款新品轨道可承载 8000W,单个适配器可承载 2500W,支持更多电器同时使用。新品配备自回弹关闭式保护门,取下适配器后,保护门自

小米米家隐藏式智能窗帘发布:五种控制方式,599 元

感谢IT之家网友 風見暉一、Autumn_Dream 的线索投递!IT之家 3 月 24 日消息,小米智能生态今日推出一款米家隐藏式智能窗帘,新品首发价 599 元,将于 3 月 25 日 10 点开售。IT之家从官方海报获悉,这款新品仅有“半掌大小”,配备强劲性能电机,支持五种控制方式:语音、手机远程、自动定时、遥控器以及手拉。此外,该产品还具有丰富的智能功能设置,支持三挡调速、手拉控速、单

Signify 扩充 Philips Hue 智能生态,有望今秋发布视频门铃

IT之家 3 月 24 日消息,科技媒体 HueBlog 昨日(3 月 23 日)发布博文,基于 iOS 版 Philips Hue 应用泄露的信息,Signify 公司即将推出其 Philips Hue 系列视频门铃。IT之家注:Philips Hue 系列已涵盖多种智能家居设备,但此前并未包括视频门铃,此次泄露显示,该产品可能在未来几个月内面世。消息源表示 iOS 版 Philips Hue

小米明日发布“掌控家中每一缕阳光”的米家新品,网友期待窗帘电机

感谢IT之家网友 風見暉一 的线索投递!IT之家 3 月 23 日消息,小米智能生态官微今日发布了一张预告图,宣告米家“智能〇〇新品”明天(IT之家注:3 月 24 日)见。官方的宣传语称,这款产品体型小巧,仅有半个手掌一般大,同时具备强劲动力,更能“掌控家中每一缕阳光”。在这条微博的评论区下,有不少网友期待这款新品将是窗帘电机。去年 6 月,小米推出了米家智能窗帘 2,具备多重降噪减震设计和

消息称微软云 OpenAI 业务的全球营收中,约 1/4 来自中国互联网巨头

IT之家 3 月 25 日消息,据雷峰网今日援引多位业内人士消息,去年下半年,微软云 OpenAI 业务的全球营收中,来自中国市场的占比最高,约为 1/4。报道提到,这些客户包括大模型公司、有大模型业务的互联网巨头以及出海中企等。报道还称,过去两年,中国市场上,Azure OpenAI Service 等相关服务快速拉动着微软云中国的营收,目前已成为其新的增长引擎。IT之家查询获悉,微软 202

蚂蚁集团推出两款 MoE 大模型,用国产芯片训练成本显著降低

IT之家 3 月 24 日消息,据证券时报报道,近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高

​前英特尔CEO批评英伟达AI芯片定价,认为推理才是未来机遇

前英特尔首席执行官帕特・盖尔辛格(Pat Gelsinger)近日在英伟达2025年 GPU 技术大会的《Acquired》播客中表示,英伟达的人工智能(AI)图形处理器(GPU)定价策略过高,难以支持大规模的 AI 推理任务。盖尔辛格指出,推理是部署 AI 模型的关键环节,当前行业的发展趋势应该更关注推理,而英伟达的技术在成本效益上难以满足这一需求。图源备注:图片由AI生成,图片授权服务商Mid