MyPillow 创始人律师使用 AI 生成的法律文件引发丑闻

MyPillow 创始人迈克・林德尔(Mike Lindell)因其对特朗普选举谎言的坚定支持而面临多起法律纠纷。其中,在丹佛的一个案件中,林德尔正被前美国选举供应商 Dominion Voting Systems 的员工埃里克・库默(Eric Coomer)控告诽谤。库默指控林德尔因其对2020年总统选举的偏执言论而损害了他的名誉。然而,这个案件近期变得更加离奇。林德尔的律师克里斯托弗・卡丘罗夫

豪掷千万美元拿稀缺域名,硅基智能发布新一代数字人交互基础设施DUIX

近日,AI数字人科技公司硅基智能宣布1000万美元收购稀缺四字母.com域名DUIX.com。与域名收购同步进行的,是硅基智能旗下同名数字人实时交互平台的正式上线。据介绍,新推出的平台名为DUIX,全称Dialogue User Interface System,旨在定位为新一代数字人智能交互基础设施。该平台将为开发者提供一整套便捷的工具和服务,包括API接入、SDK开发包,同时还设置了免费的实时

字节Seed 团队推出 PHD-Transformer,成功扩展预训练长度,解决 KV 缓存问题!

近日,字节跳动的 Seed 团队在人工智能领域再传佳音,推出了一种新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),这项创新突破了预训练长度的限制,有效解决了推理过程中的 KV 缓存膨胀问题。随着大型推理模型的迅速发展,研究人员在后训练阶段尝试通过强化学习方法来生成更长的推理链,并在复杂的推理任务上取得了显著成果。受到启发,字节 S

Firefly Image Model 4 – Adobe 推出的图像生成模型

Firefly Image Model 4是什么Firefly Image Model 4 是 Adobe 最新推出的图像生成模型,是目前最快、最具控制性和最逼真的 Firefly 图像模型,支持生成逼真的图像,提供更高的分辨率(最高可达2K)和更精细的创意控制。模型支持用户调整生成图像的结构、风格、相机角度和缩放比例,快速探索和迭代创意概念。Firefly Image Model 4 Ult

LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型

LiveCC是什么LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容,同步生成自然流畅的语音或文字解说。LiveCC 推出 Live-CC-5M 数据集用在预训练,和 Live-WhisperX-526K 数据集用在高质量的监督微调。LiveCC 设计了 LiveSp

OpenMath-Nemotron – 英伟达开源的数学推理系列模型

OpenMath-Nemotron是什么OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReasoning进行训练,包含54万个独特问题及320万个长推理解决方案。OpenMath-Nemotron系列包含,OpenMath-Nemotron-1.5B、OpenMath-Nemotron

Kimi-Audio – Moonshot AI 开源的音频基础模型

Kimi-Audio是什么Kimi-Audio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音频推理和语言理解能力。核心架构采用混合音频输入(连续声学 + 离散语义标记),结合基于 LLM 的设计,支持并行生成文本和音频标记,同时通过分块流式解码器实现低延迟音频生成。Kimi-Audio

Hummingbird-0 – Tavus 推出的AI口型同步模型

Hummingbird-0是什么Hummingbird-0 是 Tavus 推出的AI口型同步模型。基于 Phoenix-3 模型开发,支持实现零样本学习,无需额外训练快速生成高精度的口型同步视频。仅需输入几秒视频,Hummingbird-0 能在短时间内生成逼真的口型效果,适合多种应用场景,如影视制作、AI 影响者内容创作、广告、本地化翻译等。Hummingbird-0支持长达 5 分钟的视

文心大模型4.5 Turbo – 百度推出的最新多模态大模型

文心大模型4.5 Turbo是什么文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相比文心大模型4.5,文心大模型4.5 Turbo的速度更快,成本大幅降低,价格下降80%,让开发者用更低的成本使用高性能AI模型,推动更多AI应用的开发和落地,适用于内容创作、智能客服、多模态交互等

Open Avatar Chat – 阿里开源的实时数字人对话系统

Open Avatar Chat是什么Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响应延迟约2.2秒),兼容多模态语言模型,包括文本、音频和视频等多种交互方式。系统基于模块化设计,用户根据需求灵活替换组件,实现不同的功能组合。Open Avatar Chat 为开发者和研究

RAGEN – 训练大模型推理 Agent 的开源强化学习框架

RAGEN是什么RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过多轮交互优化整个轨迹,支持PPO、GRPO等多种优化策略。RAGEN通过MDP形式化Agent与环境的交互,引入渐进式奖励归一化策略,有效解决了多轮强化学习

Gmail 更新:Android 平板用户迎来全新界面和 AI 功能

最近,谷歌为其 Gmail 移动应用推出了一系列更新,涵盖 Android 和 iOS 用户。这次更新不仅带来了设计上的改进,还增加了对 AI 功能的访问,旨在提升用户体验。对于 Android 平板和可折叠设备的用户来说,Gmail 应用界面的灵活性得到了显著提升。用户现在可以在横向视图中自由拖动分隔线,以调整列表和对话窗格的大小。如果用户更喜欢单窗格视图,只需将分隔线拖到一侧即可。这项更新目前

Alphabet 第一季度业绩超预期,宣布700亿美元股票回购,AI 概览月活达15亿

谷歌母公司 Alphabet 公布2025年第一季度业绩,营收达到902.3亿美元,每股收益2.81美元,双双超出华尔街分析师的预期。受此消息提振,Alphabet 股价在盘后交易中上涨4%。首席执行官桑达尔·皮查伊 (Sundar Pichai) 将谷歌核心搜索业务的强劲表现和稳定的广告收入视为本季度业绩的关键驱动力。广告收入同比增长8.5% 至668.9亿美元,占据总收入的四分之三。尽管增速较

​芯驰发布新一代4纳米 AI 座舱芯片 X10,提升智能驾驶体验

在2025上海车展上,芯驰科技正式推出了最新研发的 AI 座舱芯片 ——X10。这款芯片采用了先进的4纳米制程工艺,具备强大的计算能力,能够支持7B 参数的多模态大模型在端侧的本地部署。这标志着芯驰科技在智能座舱芯片领域的一次重大突破,预计将大幅提升智能驾驶体验。从技术规格来看,X10芯片配备了200K DMIPS 算力的 Arm v9.2架构 CPU,搭载1.8TFLOPS 算力的 GPU 以及

Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、Gemini

在 AI 行业竞争日益激烈的今天,Ema 公司推出了一款新型语言模型 EmaFusion,声称在成本和准确性上超越了包括 O3、Gemini 和 Sonnet 在内的多款知名 AI 模型。与传统的单一策略系统不同,EmaFusion 采用了一种 “级联” 判断系统,能够动态平衡成本和准确性,同时用户也可以根据具体任务的需求进行微调。Ema 的首席执行官 Surojit Chatterjee 表示,

​谷歌AI发布601个真实世界的生成式AI应用案例,涵盖各行业

谷歌云近期发布了一份令人瞩目的报告,展示了601个来自全球顶尖企业的真实世界生成式 AI(GenAI)应用案例。这一数字比去年在谷歌云大会上分享的101个案例增长了六倍,展现了生成式 AI 技术从原型走向生产应用的飞速进展,这些技术正在几乎所有行业中推动变革。在2025年谷歌云大会上宣布的这份报告涵盖了从优步、三星、花旗到梅赛德斯 - 奔驰、德意志银行和阿拉斯加航空等多家知名公司的应用。这些案例强

​Waymo CEO暗示未来可能出售个人自动驾驶汽车

在最近的一次财报电话会议上,Alphabet 首席执行官桑达尔・皮查伊(Sundar Pichai)透露,Waymo 未来有可能会出售自动驾驶汽车供个人拥有。这一消息引起了广泛关注,皮查伊在会上被问及 Waymo 的长期商业模式时表示,除了与 Moove 和 Uber 等合作伙伴的扩展外,Waymo 还考虑 “个人所有权的未来选项”。图源备注:图片由AI生成,图片授权服务商Midjourney事实

微软发布全新Agent操作系统UFO² ,深度整合Windows与智能自动化

近日,微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。这种方式相比传统的机器人流程自动化(RPA),能够在执行复杂业务时更加高效且精准。例如

​OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o

OpenAI 最近宣布对其 ChatGPT 的 GPT-4o 版本进行了更新。这次更新主要集中在如何保存记忆的时机以及在科学、技术、工程和数学(STEM)等领域的技能提升。此外,新版本还旨在更有效地引导对话朝着 “富有成效的结果” 发展。OpenAI 希望通过这些改进,使模型在各种任务中显得更加 “直观和高效”。OpenAI 首席执行官山姆・阿尔特曼表示,这次更新不仅提升了智能水平,还改善了模型的

Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆

近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构,并结合Whisper技