刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

声明:本文来自于微信公众号 量子位,作者:金磊,授权站长之家转载发布。不得了。现在的国产AI应用,一口气看好几分钟的视频,都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段,AI就摇身一变成“名侦探”做剖析:它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。如果再给这个AI“喂”上一段足球游戏,它又会秒变成一位资深解说员:这一次,在视频总结和视频要点之后,我们继续提出

​人工智能开发平台Hugging Face 收购 Pollen Robotics,加速开源机器人发展

人工智能开发平台Hugging Face宣布收购法国机器人初创公司Pollen Robotics,交易金额未披露。此举标志着Hugging Face首次进军硬件领域,旨在推动开源机器人技术在全球的普及与发展。Pollen Robotics成立于2016年,总部位于法国波尔多,以开发开源人形机器人Reachy2闻名。该机器人定价约7万美元,已被美国康奈尔大学和卡内基梅隆大学等研究机构采用,用于探索机

谷歌Gemini推出新功能 “Circle Screen”,精准搜索更便捷

最新消息显示,谷歌正在开发一项名为 “Circle Screen” 的新功能,旨在提升用户在 Gemini AI 平台上的搜索体验。根据科技媒体 Android Authority 的报道,谷歌在 Instagram 上意外发布了一段视频,展示了 Gemini 的屏幕共享功能,并透露了这个尚未公开的新选项。“Circle Screen” 功能的最大亮点在于用户可以通过圈选屏幕的特定区域,来进行更为

Suno AI即将推出V4.5版本:音乐生成技术再升级

人工智能音乐生成平台Suno AI即将推出其V4.5版本。这一消息引发了音乐创作者与科技爱好者的广泛关注,预示着Suno在音乐生成领域的又一次技术飞跃。V4.5版本:更精细的音乐控制与音质提升社交媒体上的消息显示,Suno V4.5将为用户提供更强大的音乐生成控制功能。与之前的V4版本相比,V4.5有望解决先前版本中音乐轻浮感过重的问题,进一步优化音质表现。开发团队针对音频生成的细节进行了改良,特

​瑞士研究人员承认在 Reddit 上秘密发布 AI 生成内容,涉嫌违反伦理

瑞士苏黎世大学的研究人员承认,他们在著名的 Reddit 社区 r/changemyview 上秘密发布了由人工智能生成的帖子,目的是为了科学研究。研究人员在一份草稿报告中指出,r/changemyview 是一个用户分享各种观点的地方,旨在通过提出论据和反论据来挑战他人的观点,从而进行文明的讨论。研究者希望通过该平台探讨大型语言模型(LLM)生成的内容是否能够改变读者的看法,因此他们以半自动化的

顺丰同城:已与豆包、腾讯混元等多个厂商达成合作

近日,顺丰同城宣布,将在各个业务环节全面推进运营数字化和人工智能(AI)决策的智能化。公司希望借此建立一个更适合即时配送行业的大型模型基础设施,以实现更高效的运营和服务。为了实现这一目标,顺丰同城依托 DeepSeek 的开源生态系统及其多模态 AI 能力,能够快速进行定制化开发。这意味着,顺丰同城可以根据不同客户的具体需求,迅速调整其服务和产品,以满足市场的多样性。这种灵活性大大缩短了项目的落地

国行版iPhone即将变身AI手机:iOS 18.5正式版已在路上

快科技4月25日消息,据媒体报道,经过将近一个月的测试,苹果将在5月份推送iOS 18.5正式版。该版本将为国行版iPhone带来Apple智能,目前美版、欧版iPhone都已上线Apple智能,但国行版iPhone仍然缺席。据悉,Apple智能(Apple Intelligence)是一种基于个人场景的生成式AI系统,能提供协助辅助、图像创作等智能化功能。具体来说,Apple智能涵盖了一系列

Genspark发布类似Manus的通用AI代理:Genspark Super Agent

2025 年 4 月 2 日,加利福尼亚——人工智能领域的竞争再掀波澜。继中国初创公司Butterfly Effect推出备受瞩目的通用AI代理Manus之后,由前百度高管景鲲创立的美国公司Genspark今日宣布推出其全新产品"Genspark Super Agent",号称是一款"快速、准确、可控"的通用AI代理。这一消息迅速在技术社区引发热议,众多专业人士将其与Manus相提并论,认为这标志

ChatGPT客户端界面更新,工具选项整合为滑块式设计

ChatGPT客户端于2025年5月6日迎来了一次细微但实用的界面更新。此次更新将图像生成、搜索、深度研究等多种工具选项整合为一个全新的滑块式图标,旨在提升用户操作效率与界面简洁性。社交媒体反馈显示,这一变化已逐步在iOS和Android平台的ChatGPT应用中上线,受到用户广泛关注。滑块式图标:一键展开多功能工具新版ChatGPT客户端的最大亮点在于将原本分散的工具选项(如图像生成、网页搜索、

Meta AI眼镜“实时翻译”功能全面开放,不联网也能用!

据 The Verge 等外媒当地时间 23 日报道,Meta 正在将包括实时翻译在内的各种 AI 功能扩展应用到雷朋智能眼镜当中。据悉,此前此前仅向“抢先体验计划”用户提供的实时翻译、通过 Instagram 发送消息和进行通话、基于周边视觉信息与 “Meta AI” 进行对话等功能,现在都将面向普通用户开放。实时翻译、通过 Instagram 发送消息和拨打电话、以及根据周围环境视觉信息与