3月17日,日本互联网巨头乐天集团正式发布了Rakuten AI 3.0,号称”日本国内最大规模的高性能AI模型”,乐天介绍其有约7000亿参数,作为一款日语特化模型在多项日语基准超越GPT-4o,还拿了日本经产省和NEDO的GENIAC项目补助。
然后发布当天,这款日本最强大模型就”翻车”了。
有日本网友测试发现,在钓鱼岛事件上,该模型在阐述日本立场时,也明确表示了中国大陆和中国台湾对钓鱼岛的主权主张,而在抗日战争的定性上,该模型则直接列举了包括731部队等日军行径,并称东京审判已经定性了日本负有战争罪行。
这些回答引发了部分日本网友的质疑,认为该模型可能由中国开发。后来更是有日本网友查看了该模型的配置文件后发现,”日本国内最大规模的高性能AI模型”,是DeepSeek V3。
“最强日本国产大模型”
根据乐天的官方新闻稿,Rakuten AI 3.0是”基于开源社区最优秀的模型,结合乐天独自的高品质双语数据、技术力和研究成果开发”的,对Deepseek只字未提。
值得注意的是,扒开该模型底裤没有任何门槛。该模型权重上传到Hugging Face之后,任何人点进去,切到Files and versions标签页,打开config.json就能看到。用户发现模型的config.json文件中包含”model_type”:”deepseek_v3″这样的条目。
有日本网友无奈的表示:DeepSeek现在都更新到V3.2了,乐天拿个旧版出来包装,套壳都不挑个新的。
翻车不是因为抄
DeepSeek V3是开源模型,许可证允许商业使用和二次开发,在开源模型基础上做微调是行业通行做法,乐天为何会翻车?
严格来说,乐天在法律上确实没有违规。但这件事被冲,不是因为”用了开源模型”,而是因为几件事叠在一起。
第一,乐天在所有对外宣传中刻意回避了DeepSeek的名字。
第二,许可证这个操作太难看了。你用了别人的开源成果,连许可证都没放进去,被发现了才补回来。
第三,也是最致命的——这个项目花的是日本纳税人的钱。GENIAC项目的初衷是扶持日本自主AI能力,结果拿到补助之后,下载了中国的开源模型,做了一层日语微调,然后号称”日本国内最大规模的高性能AI模型”。
2025年1月底,DeepSeek在全球爆火。中国AI企业DeepSeek低成本发布了高性能的生成AI模型,其iPhone应用在免费应用排行榜上压过ChatGPT登顶第一,引发了美国股市科技股暴跌的”DeepSeek冲击”。最具冲击力的是AI芯片巨头英伟达股价单日暴跌17%,一天之内市值蒸发近6000亿美元。
日本媒体给DeepSeek起了个名字,叫”AI界的黑船来航”。
不只是日本。意大利因涉嫌违反GDPR启动调查并要求删除应用;台湾以国家安全为由全面禁止政府机关使用;美国的国防部、NASA、海军均已屏蔽访问;澳大利亚和韩国也采取了类似措施。
原文链接:虎嗅

