美图WHEE推出图像生成模型 Miracle F1 :风格多元更逼真

近日,WHEE 平台推出了全新的人工智能图像生成模型 Miracle F1,该模型以其极高的图像生成质量和对复杂概念的精准理解,为 AI 图像创作领域带来了新的突破。Miracle F1的一大亮点是其能够生成极具真实感的图像。它能够像摄影师一样理解物体的反光效果,像建筑师一样精准地计算空间透视关系,像画家一样捕捉光线流动的轨迹,从而实现了画面质感和语义理解的跨越式升级。通过智能模拟真实世界的光影和

DeepWiki:AI驱动的GitHub代码库百科全书正式亮相

2025年4月27日 AIbase报道,由Cognition AI推出的DeepWiki项目近日引发广泛关注。这一创新平台旨在为GitHub上的开源代码库生成动态、可交互的文档,堪称“代码库的维基百科”。规模宏大的代码索引DeepWiki的核心亮点之一是其惊人的数据处理能力。据悉,该平台已索引超过3万个热门GitHub仓库,处理了超过40亿行代码。这一庞大的数据基础不仅展示了DeepWiki的技术

腾讯混元大模型AI阅读助手——企鹅读伴正式上线

4月23日,腾讯在世界读书日当天正式上线了一款名为“企鹅读伴”的AI阅读助手。这是由腾讯混元大模型和腾讯元器平台提供技术支持的创新产品,由腾讯SSV数字支教实验室主导研发设计,旨在为中小学生带来一场充满科技感与趣味性的阅读新体验。在产品设计上,“企鹅读伴”能够根据学生的年级、阅读能力以及兴趣偏好,精准推荐适合的阅读书目。借助AI技术,“企鹅读伴”突破了传统阅读的静态局限,将文字转化为立体的阅读体验

谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式

IT之家 4 月 8 日消息,科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。Gemini 现有文件分析功能支持文档、代码、表格等类型,但暂不支持视频处理。该媒体分析 Google App 16.13.38 测试版代码,发现 Gemini 该功

企业需拥抱 “B2AI” 时代:与AI代理人的新型商业模式

随着人工智能(AI)的快速发展,商业模式也在悄然发生变化。过去我们熟悉的 “B2C”(企业对消费者)和 “B2B”(企业对企业)模式,正在迎来一个全新的概念 ——“B2AI”(企业对 AI)。根据 Visa 与未来研究所的最新报告,这一转变可能会对商业和个人金融产生深远的影响。报告指出,虽然许多人尚未普遍使用个人 AI 工具,但这些技术已经悄然进入市场。就像企业为了吸引消费者而调整搜索引擎优化(S

小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

感谢IT之家网友 软媒用户1392612 的线索投递!IT之家 4 月 30 日消息,小米大模型团队通过“Xiaomi MiMo”公众号宣布,今天,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBenc

字节跳动推出DreamActor-M1:实现Runway Act 功能,挑战动画生成新高度

近日,字节跳动(ByteDance)正式公布了其最新AI项目“DreamActor-M1”,一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频,能够将照片中的人物无缝替换到视频场景中,生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相,不仅标志着字节跳动在生成式AI领域的又一次突破,也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。Dr

​通义千问Qwen3发布:推理能力显著增强 支持两种思考模式

通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,展现了极具竞争力的结果。其中,小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,但表现更胜一筹,而像Qwen3-4B这样的小模型

天津:争建国家脑机接口技术创新中心

IT之家 4 月 16 日消息,IT之家从天津市科学技术局获悉,《天津市促进人工智能创新发展三年行动方案 (2025-2027 年)(征求意见稿)》昨日公开征求意见。《方案(征求意见稿)》提到,推动前沿基础理论研究,支持自然语言处理、机器视觉、深度学习、感知算法、大模型训练架构等基础算法研究;支持数据安全、模型安全、应用安全等技术的研发;巩固脑机交互技术优势,推动脑机交互与人机共融技术研发应用;

谷歌 AI 模式新增多模态搜索,支持图像提问功能

感谢IT之家网友 咩咩洋 的线索投递!IT之家 4 月 8 日消息,谷歌正在为其谷歌搜索实验项目“AI 模式”引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题,并通过追问深入探索相关主题。如今,拥有 AI 模式访问权限的用户可以点击该功能,针对他们上传的照片或使用相机拍摄的照片提出问题。IT之家注意到,谷歌在本周一的博客文章中表示,AI 模式中的新图像分析功能由 Google

超微公司因客户支出延迟下调业绩预期,引发 AI 投资担忧

近日,知名 AI 服务器制造商超微计算机(Super Micro Computer)发布声明,宣布将其第三季度的收入和利润预期大幅下调。原因是部分客户在支出上出现了延迟,这一消息引发了市场对 AI 相关投资放缓的担忧,导致超微股票在随后的交易中暴跌了16%。 超微公司曾在 AI 浪潮中崭露头角,但近来的业绩下滑让投资者对其前景产生了疑虑。根据公司的最新指引,预计截至3月31日的第三季度收入将从之前

可生成 AI 播客:谷歌 NotebookLM 音频概览功能新增 76 种语言支持,包含中文

IT之家 4 月 30 日消息,谷歌宣布其基于人工智能的笔记和研究助手工具 NotebookLM 的“音频概览(Audio Overviews)”功能新增 76 种语言支持。该功能于去年推出,旨在通过人工智能虚拟主持人根据用户上传到 NotebookLM 的文档(如课程阅读材料或法律摘要)生成播客,帮助用户以另一种方式理解和消化文档中的信息。谷歌表示,此前“音频概览”功能仅支持用户账户所设置的首

惊!微信公号可以AI自动回复私信了,你们以后可以24小时和我聊天了!

声明:本文来自于微信公众号 一个胖子的世界,作者:柳胖胖,授权站长之家转载发布。今天上午10点15,微信公号发来了AI智能回复功能的开通邀请,我第一时间(其实我下午才看到)开通了一下,它号称可以基于我发的历史文章,来自动回复公号的私信。这个功能应该之前就在内测了,等于是生成了一个我的知识库(公众号版)。想知道互动效果咋样,你们可以发公号私信来试试😊开通的过程也挺有意思,就在我以为和公号的一般功

Grok 3.5测试版下周上线,专为SuperGrok用户打造,专注火箭发动机与电化学技术解答

xAI宣布Grok3.5测试版将于下周正式推出,首批仅对SuperGrok订阅用户开放。据AIbase了解,该版本以其在火箭发动机和电化学等领域的精准技术解答能力引发热议,号称“全球首个人工智能能从第一性原理推理,生成网络上不存在的答案”。社交平台上的讨论显示,Grok3.5的专项技术能力与开放性备受期待,相关细节已通过xAI官网(x.ai)与社交媒体逐步公开。核心功能:第一性原理推理与技术专精G

xAI 推出 Grok Studio 功能:可 AI 编辑创建文档、代码、报告等

感谢IT之家网友 JosephCooper 的线索投递! IT之家 4 月 16 日消息,Grok 官方账号今天(4 月 16 日)发布推文,宣布新增 Grok Studio 功能,类似 OpenAI 的 Canvas 工具,支持用户编辑和创建文档及基础应用程序。IT之家附上演示视频如下:用户使用 Grok Studio 工具,可以编辑和创建文档、代码、报告,甚至是简单的浏览器游戏。官方表示,G

告别“扁平”AI!TesserAct 给AI装上4D大脑,让机器人真正看懂三维世界!

你是否注意到,那些让我们惊叹不已的AI虽然能写诗作画,却对我们生活的三维空间理解有限?当今大多数AI世界模型仍在二维平面中"思考",它们能识别照片中的猫咪,却难以理解物体在空间中的位置、形状与深度。这种"二维诅咒"严重限制了AI,特别是机器人在现实世界中的应用能力。来自UMass Amherst、HKUST和哈佛的研究团队带来了突破性解决方案——TesserAct,一个真正能够理解四维世界的AI模

AI音乐侵权战争:科技巨头与音乐产业的无休止博弈

在数字时代的战场上,音乐产业正展开一场前所未有的保卫战。面对人工智能带来的深度伪造威胁,唱片公司、艺术家和制作人正通过各种渠道奋力抵抗,然而这条维权之路却充满荆棘。索尼音乐近期透露,公司已经要求清除多达75,000个深度伪造内容。这个惊人数字揭示了当前AI侵权问题的严峻程度。信息安全公司Pindrop指出,AI生成的音乐通常具有"明显特征",理论上容易被识别——"即使听起来很逼真,AI生成的歌曲在

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期

AI机器人公司X-ORIGIN-AI获近亿元A轮融资 推动情感交互AI硬件发展

近日,消费级AI机器人公司X-ORIGIN-AI(玄源科技)宣布完成近亿元Pre-A轮融资。本轮融资由东方富海领投,金鼎资本与联想之星跟投,仁辰资本担任财务顾问。此次融资加速了X-ORIGIN-AI在AI硬件及情感交互领域的布局,展现出其在“情感化”AI产品研发上的突破。X-ORIGIN-AI致力于突破传统AI工具化的局限,推动人机交互从“工具化”向“情感化”升级。公司聚焦儿童、成人和老年群体的“

Mac也能跑Qwen3,一文看懂本地部署qwen 3配置要求

本地部署 Qwen3模型:借助 Ollama 在 Mac 上畅享大模型力量随着大型语言模型技术的飞速发展,越来越多的用户希望能在本地环境中运行这些强大的模型,以获得更好的数据隐私、更快的响应速度以及更灵活的定制性。好消息是,知名的模型运行平台 Ollama 已经全面支持 Qwen3系列模型,这使得在个人设备上本地部署 Qwen3成为可能。本文将重点介绍如何利用 Ollama 在 Mac 设备上进行