Meta Llama 4 发布 36 小时“差评如潮”,匿名员工爆料拒绝署名技术报告
Meta 最新基础模型 Llama 4 发布 36 小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在 [各种测试] 中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。具体来看,大家的抱怨主要集中在代码能力。最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。反映在榜单上,成绩也相当割裂。发布时的官方测评(LiveCodeBench)分数