DeepSeek是否从OpenAI蒸馏而来尚无定论,但存在争议。
DeepSeek是一家成立于2023年的大模型公司,其母公司为幻方量化,主要从事量化投资。DeepSeek-V3模型的训练成本约为558万美元,不到OpenAI GPT-4模型的十分之一,但其性能已接近GPT-4。此外,DeepSeek在训练模型时采用了“模型蒸馏”技术,这种技术通过使用一个大型、高精度的“教师模型”来训练一个更小、更高效的“学生模型”。这种技术在AI领域是常见的,特别是在资源有限的情况下,研究团队通常会利用开源的强大模型来训练新模型。
然而,OpenAI指控DeepSeek涉嫌通过蒸馏技术侵犯其知识产权。OpenAI表示已经发现证据证明DeepSeek利用了他们的模型进行训练,并涉嫌侵犯知识产权。尽管OpenAI没有透露具体证据,但表示掌握了确凿的数据。
目前,关于DeepSeek是否从OpenAI蒸馏而来的问题尚无定论,但这一争议在AI领域引起了广泛关注和讨论。