IT之家 1 月 27 日消息,深度求索旗下 AI 智能助手應用 DeepSeek 已在美區(qū)下載榜上超越 ChatGPT,并登頂蘋果 App Store 免費應用榜。 應用介紹顯示,DeepSeek AI 助手采用總參數(shù)超 600B 的 DeepSeek-V3 大模型,支持智能對話、AI 搜索、深度思考、文件上傳等功能。 IT之家此前報道,幻方量化旗下 AI 公司深度求索(DeepSeek)本月(1 月 20 日)正式發(fā)布 DeepSeek-R1 模型,并同步開源模型權重。據(jù)官方介紹,DeepSeek-R1 在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。 第三方基準測試顯示,DeepSeek-R1 超越了部分人工智能公司,包括 OpenAI、Meta 和 Anthropic。目前,DeepSeek 已將 DeepSeek-R1 訓練技術全部公開,在發(fā)布并開源 R1 的同時,同步在協(xié)議授權層面也進行了如下調整: 模型開源 License 統(tǒng)一使用 MIT。我們曾針對大模型開源的特點,參考當前行業(yè)的通行實踐,特別引入 DeepSeek License 為開源社區(qū)提供授權,但實踐表明非標準的開源 License 可能反而增加了開發(fā)者的理解成本。為此,此次我們的開源倉庫(包括模型權重)統(tǒng)一采用標準化、寬松的 MIT License,完全開源,不限制商用,無需申請。 產(chǎn)品協(xié)議明確可“模型蒸餾”。為了進一步促進技術的開源和共享,我們決定支持用戶進行“模型蒸餾”。我們已更新線上產(chǎn)品的用戶協(xié)議,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。