李飞飞团队推出新型图像处理技术,打破传统界限

在计算机视觉领域,如何高效地处理图像一直是研究的热点话题。近日,斯坦福大学的李飞飞教授和吴佳俊教授的团队发布了一项新的研究成果,提出了一种名为 “FlowMo” 的创新型图像 tokenizer。这种新方法在不依赖卷积神经网络(CNN)和生成对抗网络(GAN)的情况下,显著提升了图像重建的质量。当我们看到一张猫咪的照片时,大脑可以瞬间识别出那是一只猫。然而,对于计算机而言,处理图像则显得复杂得多。

前字节跳动AI专家加盟千寻智能,助推具身智能技术发展

在AI领域引发广泛关注的消息传来,前字节跳动的 AI 技术专家解浚源已正式加入具身智能创业公司千寻智能,担任具身智能部负责人。这一变化不仅为千寻智能的技术团队注入了强大的动力,也为具身智能的未来发展铺平了道路。解浚源是一位在人工智能领域颇具声望的人物。他本科毕业于中国科学技术大学,并在美国华盛顿大学获得博士学位。他在多个顶级学术会议上发表过论文,且这些论文的引用次数超过了一万次,显示出他在该领域的

字节推文生图框架InfiniteYou :可保持人脸特征,场景随便换

字节跳动悄悄咪咪推出了一款名为 InfiniteYou (InfU), 的图像生成神器。简单的说,这是一款文本到图像的生成模型,它的厉害之处在于,能够根据你输入的文字描述,生成带有你个人身份特征的高质量图像。这可不是简单的换脸App能比的,它更注重的是在灵活变换场景和内容的同时,精准保留你的身份特征。想象一下,你可以轻松生成自己穿着宇航服漫步太空、身着古装穿越回古代的照片,而且保证那张脸还是你自己

凌晨2点,再次Open,奥特曼宣布:OpenAI正式支持对手MCP协议

声明:本文来自于微信公众号新智元,授权站长之家转载发布。自从昨天OpenAI将GPT-4o的原生图像生成同步开放给免费用户后,今天他们又Open了一把。就在刚刚,OpenAI对其Agents SDK进行了重大更新,支持了对手Anthropic推出的MCP服务协议。凌晨2点,奥特曼便迫不及待地公布了这个消息。「大家都挺喜欢MCP的,我们也很兴奋能在我们的产品中支持它,」Altman说。「今天就可

​英伟达计划在美国投资数千亿推动半导体供应链发展

全球市值最高的半导体公司英伟达近日宣布,将在未来四年内在美国的供应链上投资数千亿美元。根据《金融时报》的报道,英伟达预计将在电子产品领域支出约 5000 亿美元,其中很大一部分将用于美国的运营。这一重大投资计划被认为是对特朗普 “美国优先” 贸易政策的响应,同时也跟随了苹果等其他科技巨头的类似公告。英伟达首席执行官黄仁勋在接受《金融时报》采访时指出,公司已经可以通过台积电(TSMC)和富士康等供应

Krea AI发布“Video Training”功能 可以训练自己的专属视频风格

Krea AI今日宣布推出全新“Video Training”功能,为用户提供了一个可定制的AI视频生成工具。这一功能的亮相在X平台上迅速引发热议,被认为是数字内容创作领域的又一里程碑突破。据介绍,“Video Training”允许用户上传自己的图像和视频素材,训练出专属的AI视频风格模型。该功能使用的是 Wan2.1模型,支持学习特定的艺术风格、动作特征或物体细节。用户可以通过上传静态图像让A

AI时代,知乎翻身的机会可能到了

声明:本文来自于微信公众号互联网怪盗团,作者:怪盗团团长裴培,授权站长之家转载发布。有两个社交媒体平台,我平时很少发言,但是经常刷:一个是最近很火的小红书,另一个就是知乎。在知乎,我最常看的品类是文史类,其次是体育类和语言类(因为最近在学日语);过去两年,AI大模型刚刚热起来的时候,我还在知乎读过不少文献综述,从而实现了对大模型技术的“脱盲”。因为我平均每月要刷几十个小时的知乎,所以对这个平台

商汤集团公布2024年业绩:生成式AI业务收入同比增103.1%

快科技3月26日消息,今日,商汤集团公布了2024年业绩,整体实现了年度收入37.7亿元,同比增长10.8%。其中生成式AI业务收入达24亿元,同比大幅增长103.1%,连续两年三位数增长,生成式AI收入比例由2023年的34.8%进一步提升至63.7%。集团毛利为16.2亿元人民币,毛利率为42.9%,亏损净额为43.07亿元人民币,按年缩窄33.7%。官方表示,日日新大模型的训练与推理成本

微软 Copilot Studio 新增“计算机使用”工具

4月16日,微软宣布在 Copilot Studio 中推出一款名为“计算机使用”的全新研究预览工具。该工具允许 Copilot Studio 客服人员与任何网站或桌面应用程序进行交互,就像它们本身就是工具一样。客服人员现在可以点击按钮、选择菜单,并在应用程序和网站上的字段中输入信息。全新的“计算机使用”工具使客服人员能够在没有可用 API 进行编程集成的环境中运行。

腾讯的 AI 大招,落在微信上

声明:本文来自于微信公众号 唐韧,作者:唐韧,授权站长之家转载发布。很久没看到腾讯像现在这样投入资源去推一款产品了,那阵势似乎让人感受到这是鹅厂下一个希望。我说的产品,就是腾讯元宝,一个 AI 大模型工具。在腾讯元宝中,默认集成了鹅厂自家的 Hunyuan 模型和 DeepSeek 开源模型,我在之前的文章中有过体验分析。腾讯对元宝的投入大到什么程度呢?基本上,腾讯旗下的所有产品都在给元宝带节

千亿乳企的AI实战里,藏着阿里妈妈AI电商的新增长地图

声明:本文来自于微信公众号 财经无忌,作者:山核桃,授权站长之家转载发布。2025年,AI加速重构各行各业。理解这一点,电商就是一个观察切片,作为率先接入和落地AI的行业之一,AI早已融入平台运营和商家的实际经营,从不确定的技术变量转变为确定性的经营增量。以淘天为例,从用户、商家到内容,AI已带来一个“新淘天”,特别在商家侧,我们观察到,阿里妈妈从2023年开始就全面拥抱AI时代,强调AI驱动

下一代产品的“双向奔赴”鸿蒙版百度网盘发布多项领先AI能力

3 月 20 日,新款搭载鸿蒙操作系统 5 的HUAWEI Pura X发布,鸿蒙版百度网盘宣布将在新版本中升级“智能文件搜索和管理”及“视频AI笔记”等AI能力,为用户带来“大有不同”的上传下载体验。一直以来,鸿蒙版百度网盘是鸿蒙应用商店的高需应用,为响应用户强烈需要,在本次发布之前,双方团队进行了紧密合作,鸿蒙版百度网盘针对鸿蒙全场景特性进行了深度适配,确保提供便捷可靠的较好的体验。(举

​小模型助力法律行业,LexisNexis 推出 AI 助手 Protégé

法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手,旨在为、助理和法律专员提供支持。Protégé 的主要功能是帮助用户撰写和校对法律文件,并确保引用的内容在诉状和简中是准确的。LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手,而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。在开发 Protégé 的过程中,LexisNexis

开发效率提升100倍!腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型

快科技3月28日消息,腾讯云AI代码助手最新宣布,正式搭载DeepSeek-V3-0324顶级模型。无需配置,下载/更新AI代码助手插件即可用,官方号称开发效率能直接提升100倍。DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型参数从初代V3的6710亿小幅增至6850亿,依然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。虽然是小版本更新,但从反馈来看,这次升级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解,新版V3模型借鉴Deep

微信 AI 搜索新增“快速思考”,采用混元 T1 模型

IT之家 3 月 26 日消息,微信今年 2 月起灰度测试接入 DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到“AI 搜索”字样,点击进入后,可免费使用 DeepSeek-R1 满血版模型,获得更多元化的搜索体验。IT之家发现,时隔一个多月,微信 AI 搜索除了“快速回答”和“深度思考”,又新增了一个“快速思考”选项,可由腾讯混元 T1 模型经过思考而提供回答。“AI 搜索”的回

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。今天日子是2025年3月26日。OpenAI又是临时发了一个直播预告。凌晨2点要发东西。我:??????????当熬到2点看完了直播以后,我人都恍惚了,我怎么好像去年5月的时候,见过这个东西?怎么感觉特娘的我时间穿越回到1年前了?翻了一下,果然。。。2024年5月13号,GPT4o正式发布,那时候的blog里

AI拉了快手一把

声明:本文来自于微信公众号定焦One(dingjiaoone),作者:苏琦,授权站长之家转载发布。2025年开年,港股市场迎来一批股价狂飙的上市公司。它们都做对了两件事,一是找到新的增长点,例如小米押注智能汽车,二是全面发力AI,例如阿里巴巴。现在,这个名单上要加上快手。快手曾经是一家被低估的公司,也一度被贴上“下沉”“土味”的标签。实际上,从2023年Q2开始,快手已经保持7个季度盈利。它最

OpenAI 推迟免费版 ChatGPT 图像生成功能上线时间

IT之家 3 月 27 日消息,OpenAI 首席执行官萨姆奥尔特曼(Sam Altman)今天在 X 上承认,ChatGPT 中图像生成工具的受欢迎程度远超预期,所以免费版用户的上线计划将不得不推迟一段时间。就在昨天,OpenAI 举行直播,宣布 GPT-4o 的原生图像生成大升级,奥尔特曼更是亲自上阵演示了制作梗图、文本渲染、多轮交互生成和指令遵循等功能。当然,OpenAI 也为 ChatG

告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度,多样性飙升23%!

Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。这项发表在最新研究论文中的技术,核心在于将“偏差指标”引入人工智能的训练过程。其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。研究人员利用嵌入文本及其成对余弦距离来计算这些差异,从而为系统提供了一种理解文本变异性的数学框架。这种新的