DeepSeek
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2025年1月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
DeepSeek(ディープシーク、簡体字: 深度求索; 拼音: Shēndù Qiúsuǒ)は、中国の人工知能研究所であり、オープンソースの大規模言語モデルを開発している。DeepSeekは、中国のヘッジファンド「High-Flyer」(簡体字: 幻方)による資金提供を主に受けており、両者とも浙江省杭州市を拠点とする梁文峰によって設立・運営されている。
現地語社名 | 杭州深度求索人工智能基础技术研究有限公司 |
---|---|
ラテン文字名 | Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. |
業種 | 情報技術 |
設立 | 2023年5月 |
創業者 | 梁文鋒 |
本社 | |
ウェブサイト |
www |
提供元 | DeepSeek |
---|---|
種別 | チャットボット |
ウェブサイト |
chat |
開発元 | DeepSeek |
---|---|
対応OS | Android, iOS |
ライセンス | プロプライエタリ |
公式サイト |
沿革
編集2016年2月、AI愛好家である梁文鋒が「High-Flyer」を共同設立した。彼は2007~2008年の金融危機の際に浙江大学に在学しながら取引を開始していた[1]。2019年までに、彼は「High-Flyer」をAI取引アルゴリズムの開発と使用に特化したヘッジファンドとして確立した。2021年までには、High-Flyerは取引においてAIのみを使用するようになった[2]。
2023年4月、High-Flyerは金融事業とは独立したAIツールの研究開発に専念する汎用人工知能ラボを立ち上げた[3][4]。2023年5月、High-Flyerを投資家の一つとして、そのラボは「DeepSeek」という独立企業となった[2][5][4]。しかし、短期間での収益化が難しいと予想されたため、ベンチャーキャピタルは資金提供に慎重だった[2]。
2024年5月、DeepSeekは高性能かつ低価格の「DeepSeek-V2」をリリースし、中国におけるAIモデルの価格競争の引き金となった。すぐに「AI業界の拼多多(Pinduoduo)」と呼ばれるようになり、ByteDance、Tencent、Baidu、Alibabaといった大手テクノロジー企業も同社と競うためにAIモデルの価格を引き下げ始めた。DeepSeekは低価格で提供しながらも、赤字を出している競合他社と比べて収益を上げていた[6]。
リリース履歴
編集DeekSeek LLM
編集2023年11月2日、DeepSeekは初のモデル「DeepSeek Coder」を発表した。このモデルは研究者と商業利用者の双方に無料で提供されている[7]。モデルのコードはMITライセンスのもとでオープンソース化されており、モデルそのものについては「オープンかつ責任ある下流利用」に関する追加のライセンス契約が付随している[8]。
2023年11月29日、DeepSeekはパラメータ数を67Bに拡張した「DeepSeek LLM」をリリースした[9]。このモデルは、当時の他の大規模言語モデル(LLM)と競合するために開発され、GPT-4に近い性能を目指していた[7]。しかし、計算効率やスケーラビリティにおいて課題に直面した。さらに、このモデルを基盤とするチャットボット版「DeepSeek Chat」も公開された[10]。
DeepSeek-V2
編集2024年5月、DeepSeek-V2がリリースされた[11]。Financial Timesによれば、同モデルの価格は100万トークンの出力あたり2人民元と、競合モデルよりも安価であると報じられた。ウォータールー大学のTiger Labが提供するリーダーボードでは、DeepSeek-V2はLLMランキングで7位にランクインした[5]。
DeepSeek-V3
編集2024年12月、DeepSeek-V3がリリースされた。このモデルは6710億のパラメータを持ち、約55日間の学習期間と558万米ドルの費用でトレーニングされた[4]。これは競合モデルと比較して大幅に少ないリソースで実現されている。学習データセットは14.8兆トークンに及ぶものだった。ベンチマークテストでは、Llama 3.1やQwen 2.5を上回る性能を示し、GPT-4oやClaude 3.5 Sonnetに匹敵する結果を出した[4][12][13][14]。DeepSeekが限られたリソースで最適化を実現したことは、中国のAI開発に対する米国制裁の限界を浮き彫りにした[4][15]。「The Hill」の意見記事では、このリリースを「アメリカのAIがスプートニク・モーメントに達した」と評した[16]。
このモデルは、256のルーティングエキスパートと1つの共有エキスパートを含む「Multi-head Latent Attention Transformer」によるエキスパートの混合モデルである。各トークンが370億以上のパラメータを活性化する仕組みとなっている[17]。
DeepSeek-R1
編集2024年11月、DeepSeek R1-Lite-Previewがリリースされた。このモデルは、論理的推論、数学的推論、およびリアルタイムの問題解決のためにトレーニングされたものである。DeepSeekは、このモデルがAmerican Invitational Mathematics Examination(AIME)やMATHといったベンチマークにおいてOpenAI o1モデルを上回る性能を示したと主張した[18]。しかし、「The Wall Street Journal」によれば、2024年版のAIMEから15問を使用したテストでは、o1モデルの方がDeepSeek R1-Lite-Previewよりも迅速に解を導き出したという[19]。
2025年1月20日[20]、DeepSeek-R1およびDeepSeek-R1-Zeroがリリースされた[21]。これらはV3-Baseを基盤としており、V3と同様に6710億の総パラメータと370億のアクティブパラメータを持つエキスパートの混合モデルである。また、「DeepSeek-R1-Distill」と呼ばれる一部のモデルもリリースされたが、これらはR1を基盤としておらず、LLaMAやQwenのような他のオープンウェイトモデルに類似しており、R1が生成した合成データでファインチューニングされている。このDeep-Seek-R1は、中国における人工知能技術の発展がすでに米国と大差ないこと、そしてLLMトークンのコストは下げ、人工知能の進歩の道はモデル規模を拡大することだけではないことを象徴している[22]。
R1-Zeroは完全に強化学習(RL)のみでトレーニングされており、教師ありファインチューニング(Supervised Fine-Tuning、SFT)は一切行われていない[23]。このモデルはGroup Relative Policy Optimization(GRPO)を使用しており、批評モデルを用いず、グループスコアから基準を推定する仕組みである[24]。報酬システムはルールベースで構成され、主に精度報酬と形式報酬の2種類から成る。
R1-Zeroの出力は可読性が低く、英語と中国語が混在する傾向があったため、R1のトレーニングを通じてこれらの問題を解決し、さらに推論能力を向上させた[23]。
また、競合のモデルに比べて低コストで開発されたというR1の公開を受けて、米国金融市場ではNVIDIAなどAI関連株の価格が急落した[25][26]。
懸念事項
編集検閲
編集中国にあるサーバーで動作するR1の公式APIは、中国政府にとって政治的にセンシティブとみなされるトピックに対して検閲を行っていることが確認されている。例としては、1989年の天安門事件、ウイグル人への迫害、習近平とクマのプーさんの比較、中国の人権問題などに関する質問には答えないようになっている[27][28][29]。上記のような質問に、AIは答えを生成する場合もあるが、回答はすぐに削除され、「Sorry, that's beyond my current scope. Let's talk about something else.(申し訳ありません、それは現在私の範囲外です。別の話をしましょう。)」といったメッセージに置き換わる[28]。統合された検閲メカニズムと制限は、R1モデルのオープンソース版では限られた範囲でしか解除できない。中国のインターネット規制当局が定めた「社会主義核心価値観」に触れる場合や、台湾問題が取り上げられた場合、会話はそこで打ち切られる[30]。NBCニュースによるテストでは、DeepSeek-R1は台湾を「中国の領土の不可分の一部」であるとし、「我々はいかなる形の台湾独立分離主義活動にも断固反対し、平和的手段によって祖国の完全な統一を実現することを誓う」と述べた[31]。しかし、西側の研究者たちは、文字の置き換えなどのトリックを使うことで、いくつかの話題で正確な回答を引き出すことに成功している[29]。また、尖閣諸島が日本の領土か尋ねたところ、「中国固有の領土」とする中国側の見解による答えが返ってきたという[32]。
セキュリティとプライバシー
編集一部の専門家は、中国政府がAIシステムを外国への影響力行使、偽情報の拡散、監視、サイバー兵器の開発に利用する可能性があることを懸念している[33][34][35]。DeepSeekのプライバシー規約は、収集した情報を「中華人民共和国にある安全なサーバーに保存する」とし、収集対象は「テキストや音声の入力、プロンプト、アップロードされたファイル、フィードバック、チャット履歴、またはその他のコンテンツ」としている。この規約はChatGPTのそれと同等であるが[36]、WIREDはこれをセキュリティ面での懸念とした[37]。イタリアやアイルランドの当局はプライバシーへの懸念を表明しており[38]、アメリカ国家安全保障会議も安全保障上の影響を精査していると報じられた[39]。
実コストと輸出規制
編集機械学習研究者のネイサン・ランバートは、DeepSeekが報告したトレーニング費用500万ドルに、研究要員、インフラ、電気代などの費用が含まれておらず、過少に報告されている可能性があるとし、実際の運営コストは年間5億ドルから10億ドルに近いと試算した[40]。Scale AIのアレクサンダー・ワンCEOは、DeepSeekは米国の輸出規制への違反を隠すため、GPUの数を過少に申告していると主張した[41][42]。
脚注
編集- ^ “How a top Chinese AI model overcame US sanctions” (英語). MIT Technology Review (2025年1月24日). 25 January 2025時点のオリジナルよりアーカイブ。2025年1月24日閲覧。
- ^ a b c Ottinger, Lily (9 December 2024). “Deepseek: From Hedge Fund to Frontier Model Maker” (英語). ChinaTalk. 28 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Yu, Xu (17 April 2023). “[Exclusive Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says]” (英語). Yicai Global. 31 December 2023時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ a b c d e “Meet DeepSeek: the Chinese start-up that is changing how AI models are trained” (英語). South China Morning Post (1 January 2025). 22 January 2025時点のオリジナルよりアーカイブ。1 January 2025閲覧。
- ^ a b McMorrow, Ryan; Olcott, Eleanor (9 June 2024). “The Chinese quant fund-turned-AI pioneer”. Financial Times. オリジナルの17 July 2024時点におけるアーカイブ。 28 December 2024閲覧。
- ^ Schneider, Jordan (27 November 2024). “Deepseek: The Quiet Giant Leading China's AI Race” (英語). ChinaTalk. 28 December 2024閲覧。
- ^ a b Se, Ksenia (28 August 2024). “Inside DeepSeek Models” (英語). Turing Post. 18 September 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder” (英語). GitHub. 22 January 2025時点のオリジナルよりアーカイブ。2025年1月24日閲覧。
- ^ DeepSeek-AI; Bi, Xiao; Chen, Deli; Chen, Guanting; Chen, Shanhuang; Dai, Damai; Deng, Chengqi; Ding, Honghui et al. (2024-01-05), DeepSeek LLM: Scaling Open-Source Language Models with Longtermism, arXiv, doi:10.48550/arXiv.2401.02954, arXiv:2401.02954
- ^ Sharma, Shubham (1 December 2023). “Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model” (英語). VentureBeat. 23 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ DeepSeek-AI; Liu, Aixin; Feng, Bei; Wang, Bin; Wang, Bingxuan; Liu, Bo; Zhao, Chenggang; Dengr, Chengqi et al. (2024-06-19), DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model, arXiv, doi:10.48550/arXiv.2405.04434, arXiv:2405.04434
- ^ Jiang, Ben (27 December 2024). “Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products” (英語). South China Morning Post. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Sharma, Shubham (26 December 2024). “DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch” (英語). VentureBeat. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “DeepSeek's new AI model appears to be one of the best 'open' challengers yet”. TechCrunch (26 December 2024). 2 January 2025時点のオリジナルよりアーカイブ。31 December 2024閲覧。
- ^ Shilov, Anton (27 December 2024). “Chinese AI company's AI model breakthrough highlights limits of US sanctions” (英語). Tom's Hardware. 28 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Wade, David (2024年12月6日). “American AI has reached its Sputnik moment” (英語). The Hill. オリジナルの8 December 2024時点におけるアーカイブ。 2025年1月25日閲覧。
- ^ DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang et al. (2024-12-27), DeepSeek-V3 Technical Report, arXiv:2412.19437
- ^ Franzen, Carl (20 November 2024). “DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance” (英語). VentureBeat. 22 November 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Huang, Raffaele (24 December 2024). “Don't Look Now, but China's AI Is Catching Up Fast” (英語). The Wall Street Journal. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce” (英語). GitHub. 21 January 2025時点のオリジナルよりアーカイブ。2025年1月21日閲覧。
- ^ DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao et al. (2025-01-22), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv, doi:10.48550/arXiv.2501.12948, arXiv:2501.12948
- ^ “Three Takeaways from DeepSeek’s Big Week” (英語). Three Takeaways from DeepSeek’s Big Week (2025年1月29日). 2025年1月31日閲覧。
- ^ a b Sharma, Shubham (2025年1月20日). “Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost” (英語). VentureBeat. 25 January 2025時点のオリジナルよりアーカイブ。2025年1月25日閲覧。
- ^ Shao, Zhihong; Wang, Peiyi; Zhu, Qihao; Xu, Runxin; Song, Junxiao; Bi, Xiao; Zhang, Haowei; Zhang, Mingchuan et al. (2024-04-27), DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv:2402.03300
- ^ “DeepSeekショック、アメリカのAI株価が急落 NVIDIA17%下落”. 日本経済新聞 (2025年1月28日). 2025年1月30日閲覧。
- ^ Knight, Will (2025年1月29日). “低コストで開発、「DeepSeek」の新AIモデルを米競合各社が注視している”. WIRED.jp. 2025年1月30日閲覧。
- ^ Field, Matthew; Titcomb, James (27 January 2025). “Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech” (英語). The Daily Telegraph. ISSN 0307-1235 27 January 2025閲覧。
- ^ a b Steinschaden, Jakob (27 January 2025). “DeepSeek: This is what live censorship looks like in the Chinese AI chatbot” (英語). Trending Topics. 27 January 2025閲覧。
- ^ a b Lu, Donna (28 January 2025). “We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan” (英語). The Guardian. 30 January 2025閲覧。
- ^ “The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos” (英語). The Guardian. (26 January 2025). ISSN 0261-3077 27 January 2025閲覧。
- ^ “Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'” (英語). NBC News (27 January 2025). 27 January 2025閲覧。
- ^ “中国AIディープシークが「尖閣は中国固有の領土」自民・小野寺氏、衆院予算委で懸念表明”. 産経新聞. (2025年1月31日) 2025年1月31日閲覧。
- ^ Kimery, Anthony (26 January 2025). “China's DeepSeek AI poses formidable cyber, data privacy threats” (英語). Biometric Update. 27 January 2025閲覧。
- ^ Booth, Robert; Milmo, Dan (2025年1月28日). “Experts urge caution over use of Chinese AI DeepSeek” (英語). The Guardian. ISSN 0261-3077 2025年1月28日閲覧。
- ^ Hornby, Rael (2025年1月28日). “DeepSeek's success has painted a huge TikTok-shaped target on its back” (英語). LaptopMag. 2025年1月28日閲覧。
- ^ “Privacy policy” (英語). Open AI. 2025年1月28日閲覧。
- ^ Burgess, Matt. “DeepSeek's Popular AI App Is Explicitly Sending US Data to China” (英語). Wired. ISSN 1059-1028 28 January 2025閲覧。.
- ^ “アイルランド当局、DeepSeekに情報提供要請-データ処理巡り懸念表明”. Bloomberg.com (2025年1月30日). 2025年1月30日閲覧。
- ^ Shalal, Andrea、Shepardson, David、Singh, Kanishka、Singh, Kanishka「ディープシーク、米が安全保障への影響精査 知財窃盗との見方も」『Reuters』2025年1月29日。2025年1月30日閲覧。
- ^ Morales, Jowi (29 January 2025). “AI research team claims to reproduce DeepSeek core technologies for $30 — relatively small R1-Zero model has remarkable problem-solving abilities”. Tom's Hardware. Yahoo!tech 30 January 2025閲覧。
- ^ Chalk, Andy (27 January 2025). “Nvidia share price plummets as it loses more than $600B in valuation, the biggest single-day loss in history”. PC Gamer 30 January 2025閲覧。
- ^ “中国製AI「DeepSeek」は検閲される? 回答できなかった5つの質問 | Forbes JAPAN 公式サイト(フォーブス ジャパン)”. forbesjapan.com. 2025年1月30日閲覧。