Meta Llama 4 发布 36 小时“差评如潮”,匿名员工爆料拒绝署名技术报告

Meta 最新基础模型 Llama 4 发布 36 小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在 [各种测试] 中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。具体来看,大家的抱怨主要集中在代码能力。最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。反映在榜单上,成绩也相当割裂。发布时的官方测评(LiveCodeBench)分数

1至5元不等!有人开始售卖ChatGPT生成的“吉卜力风格”图片了

短短几天内,通过 ChatGPT 生成的动画风格图片数量竟然超过了 7 亿张,在带来巨大人气的同时,质疑声也愈发高涨了。不仅存在着版权方面的争论,肖像权相关的讨论也一直没有间断。这次,又新增了“非法盈利”的争议……站长之家(ChinaZ.com)4 月 7 日 消息:最近,SNS上出现了售卖吉卜力风格图片的“交易”,一些二手交易平台上声称收到钱后就会帮忙制作吉卜力风格图片的帖子也层出不穷。吉卜

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。公司表示,这得益于一种名为“SOTA DiT-based diffusion video gen

Claude Research 功能上线:AI 驾驭复杂任务,打造成你的工作神器

IT之家 4 月 16 日消息,Anthropic 昨日(4 月 15 日)发布博文,宣布为其 Claude 推出“Research”功能,并支持 Google Workspace 集成。Claude 的 Research 功能类似 ChatGPT 的 Deep Research,官方表示将彻底改变信息获取和推理的方式。该功能可以主动进行多轮搜索,逐步深入问题,自动探索不同角度,并系统化解决开放

​马斯克的xAI宣布以 450 亿美元收购社交平台 X

近日,马斯克的人工智能创业公司 xAI 正式宣布以一项全股票交易收购社交媒体平台 X,交易金额高达约450亿美元。这一数字中包含120亿美元的债务,使得 X 的隐含股权价值达到330亿美元。马斯克在 X 平台上发表声明表示,此次合并将 “结合两家公司在数据、模型、计算、分发和人才方面的优势”,他认为这种组合将通过将 xAI 的先进 AI 能力与 X 的巨大用户基础相结合,释放出巨大的潜力。两家公司

海螺推出图像人物参考功能 允许用户基于单张图像生成多角度、动态姿势的角色图像

MiniMax旗下的Hailuo AI正式推出Hailuo Image全新功能——Character Reference,为AI图像生成领域带来突破性创新。据AIbase了解,该功能允许用户基于单张参考图像生成具有多角度、动态姿势、丰富表情的角色图像,支持电影化光影与构图,并提供全面的提示词控制。社区对这一功能的发布反响热烈,项目详情已通过Hailuo官网与GitHub公开,标志着Hailuo在角

黄仁勋揭秘自己如何用 AI 学习:先让“老师”把自己当成 12 岁小孩

IT之家 5 月 7 日消息,据《商业内幕》今日报道,现在的英伟达 CEO 黄仁勋不仅正在打造先进 AI 模型所需的核心芯片,还把这些 AI 模型当成了自己的私人导师。当地时间周二,黄仁勋出席了第 28 届米尔肯研究院全球大会的一个小组讨论会并发表讲话,谈及 ChatGPT、Gemini Pro 和 Perplexity 等工具时,黄仁勋表示:“我每天都在用它们学习。对那些我不熟悉的领域,我会先

OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议

IT之家 4 月 17 日消息,人工智能公司 OpenAI 宣布部署了一套新的监控系统,专门用于监测其最新的人工智能推理模型 o3 和 o4-mini,防止这些模型提供可能引发生物和化学威胁的有害建议。根据 OpenAI 的安全报告,该系统旨在确保模型不会为潜在的有害攻击提供指导。据 OpenAI 表示,o3 和 o4-mini 相比之前的模型在能力上有显著提升,但同时也带来了新的风险。根据 O

小鹏汽车推新物理大模型,定位AI汽车公司

近日,小鹏汽车创始人何小鹏在社交媒体上透露,作为将 “智能化” 作为核心的车企之一,小鹏汽车的本质定位在于 “AI 汽车公司”。他强调,人工智能(AI)最大的价值不仅在于数字世界的应用,更在于能够改变我们的物理世界。这一观点引发了行业内外的关注与讨论。何小鹏表示,小鹏汽车坚持全栈自研的理念,去年首次在自动驾驶领域引入了强化学习与模型蒸馏的技术路线,这一创新举措使得小鹏在行业内具备了独特竞争力。他透

50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍

IT之家 4 月 24 日消息,OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(4 月 24 日)在 X 平台发布推文,宣布针对 Plus、Team 或 Enterprise 用户,放宽模型消息限制,o3 从每周 50 条升至每周 100 条,o4-mini 从每日 150 条升至每日 300 条,o4-mini-high 升至每天 100 条。IT之家此前报道,Open

阿联酋首创:人工智能助力法律制定速度提升 70%

阿联酋近期宣布将首次利用人工智能技术参与法律的撰写工作,旨在大幅提高法律制定的效率。据悉,这一创新举措预计能将法律草案的制定时间缩短多达70%。在阿联酋的法律框架内,政府希望借助 AI 的强大分析能力,快速生成符合现代社会需求的法律文本。图源备注:图片由AI生成,图片授权服务商Midjourney阿联酋官方表示,这项技术不仅将加快立法进程,还有助于提升法律的适应性。通过 AI 的实时数据分析,法律

谷歌重申今年 750 亿美元资本支出计划:斥巨资购买芯片、服务器,持续押注生成式 AI

IT之家 4 月 10 日消息,据路透社报道,谷歌母公司 Alphabet 公司周三重申,计划今年投入约 750 亿美元(IT之家注:现汇率约合 5519.45 亿元人民币)扩建数据中心,继续押注生成式 AI,尽管回报尚不明朗,且全球贸易战可能带来成本上升的压力。Alphabet 首席执行官桑达尔・皮查伊在谷歌云计算部门的年度会议上表示,这项投资将用于采购所需的芯片和服务器,强化公司核心业务(如

或超过人类平均水平!AI 大模型将如何改造智能客服?

声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。你所在企业是否还在为智能客服的“答非所问”困扰?你们的智能客服已经接入AI大模型了吗?近期在见实的一场直播中,回应了关于智能客服的能力空间与实现路径。分享嘉宾是每日互动(个推) 产品总监高志成,他认为有了AI大语言模型之后,智能客服“所答即所问”将成为基本要求。而在此基础上还有更大发挥空间 ,当机器人的水平大于人工平均水平甚至

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

感谢IT之家网友 Skyraver 的线索投递!IT之家 4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。其数据

OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印

IT之家 4 月 22 日消息,AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。IT之家注:这些字符在普通视图中与标准空格无异,但在 SoSciSurvey 或 Sublime Text 等专业工具中,可检测其独特代码。Rumi 表示

MCP协议和Function Calling 、 AI Agents的区别是什么?MCP优势有哪些

MCP(模型上下文协议)、Function Calling 和 AI Agents 是三种重要的技术手段,它们在实现 AI 模型与外部系统交互方面各有特点。本文将详细对比这三种技术,并深入探讨 MCP 的多项显著优势。MCP、Function Calling 和 AI Agents 的区别Function Calling:平台依赖的函数调用机制Function Calling 是一种 AI 模

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

站长之家(ChinaZ.com) 5月6日 消息:据 404 Media报道,互联网最受欢迎的深度伪造色情内容在线网站 Mr. Deepfakes 于本周末永久关闭。Mr. Deepfakes 网站一度吸引了大量“不良”用户。研究人员指出,这些用户愿意支付高达 1500 美元的价格,让创作者使用先进的 AI 技术,在未经名人或其他目标人物同意的情况下,使用她们的脸制作色情视频。研究人员发现,在

亚马逊推出 Nova Act:可操控网页浏览器的 AI 智能体

感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 4 月 1 日消息,亚马逊于当地时间周一正式发布了其通用人工智能智能体(AI agent) ——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的 Nova Act 软件开发工具包(SDK),旨在帮助开发者利用 Nova Act 构建智能体应用原型。据IT之家了解,Nova Act 由亚马

Krea 上线3D 功能并重构网站:从文本到立体,创作秒成型

近日,生成式 AI 平台 Krea 宣布推出3D 生成功能,并同步完成网站界面的全面重构。这标志着 Krea 在技术创新与用户体验上的双重突破,进一步巩固其在创意工具领域的领先地位。  新上线的3D 生成功能是此次更新的核心亮点。用户可通过文本描述或2D 图像快速生成可交互的3D 对象,实时调整角度、光影与纹理。这一功能基于 Krea 自研 AI 模型和内部 GPU 集群,速度快、稳定性高,大幅降

颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体