‘Replication games’ test the robustness of social-science studies

2026年4月11日 · 吴鹏 · 来源：dev门户

在KernelBench三级测试中，模型需要对MobileNet、VGG等完整机器学习架构进行端到端优化。结果显示，GLM-5.1在50个问题上实现3.6倍几何平均加速，持续优化超过1000次工具调用。虽然Claude Opus 4.6仍以4.2倍加速领先，但GLM-5.1显著拓展了开源模型的生产力边界。

电视主持人因裤链未拉遭遇直播尴尬 20:56

苹果Arcade亟需，详情可参考adobe

俄罗斯出台出租房产需获邻居同意新规08:52

当Google彻底推倒许可权限的高墙，原本摇摆的企业级用户开始意识到"数字主权"的价值。未来24个月内，竞争重点将从"模型智能度"转向"模型自主性"。

已完成新三板摘牌

_ucase "$MATCH"

dev门户

‘Replication games’ test the robustness of social-science studies

关于作者

网友评论