1月末に中国発の軽量動作の大規模言語モデル(LLM)DeepSeekが話題になり、米国のAI関連株が暴落する、いわゆるDeepSeekショックが起き、日本でもニュース番組などで繰り返し報道された
“中国スピード”とはよく言うもので、DeepSeek R1ソリューションを企業や組織ほか、深圳などの自治体が続々と採用
2月までに、北京や上海、広州の著名な病院を筆頭に、地方のローカル病院まで民間・公立問わず、およそ100ヵ所の病院がDeepSeekを導入したと
医療機関による大規模モデルの利用が、診断と治療の効率と質の向上に大きく役立つと考えられていると
・・・不安
また広東省深圳、江蘇省無錫などの行政府でも導入され、市民からの問い合わせの応答や、政策検討・文書作成などに活用されている
完全完璧なアウトプットではないので公務員を置き換えるわけではないが、それでも作業負担をだいぶ肩代わりしていると
Githubの利用者による分析では、DeepSeek R1モデルのローカル運用を実現するには、GeFoce RTX 4090D搭載システムで7万元(約¥143万)程度は必要
それでもA100/H100を搭載したシステムの200万元(約¥4100万)の20分の1以下の価格で実現できると
輸出規制で中国版の4090Dが用意されているが
通常の4090も4090Dも大量に流通
ここで出てきたGeFoce RTX 4090“D”
米国は中国へのGeFoce RTX 4090搭載製品の販売を規制しており、その規制をクリアするために若干性能を抑えた中国向けバージョン
中国の界隈では無印はフル性能なので4090満血版、D付きには4090蒸留版という別名がある
・・・?なネーミング
後者も規制が始まったという報道もあるが
中国ではともに簡単に入手が可能なのも現状で、どこまで実効性のある規制がされているか?
さらに性能のいいGeFoce RTX 5090が発売済み
中国の報道やSNS、ギーク向けの投稿が多いビリビリを見ても、GeFoce RTX 5090関連の投稿は販売情報やベンチマーク検証コンテンツばかり
DeepSeek R1を運用するために各所で導入されている様子はまだない?
まだまだ入手しづらくコスパを考えればGeFoce RTX 4090ベースで十分ということ?
いずれにしても数百万円で業務が改善するDXは、これまでに比べ圧倒的に安上がりと報じられている
だとしても企業はもちろん、自治体でも数百万円相当のシステムを素早く導入するのだから中国スピードは実に速い
報じられている公的機関がこれだけあるのだから、民間でのニーズはそれ以上にあり、投資やリスク管理をする金融機関や研究・教育用途に導入する企業は間違いなく多い?
深圳の電子街では4090の魔改造版や
DeepSeek向け独自ショップブランドPCをサポート付きで販売
そこで深圳の電子街 華強北(ファーチャンベイ)
中国への販売が規制されているはずの無印Geforce RTX 4090搭載製品が売られるだけでなく、魔改版Geforce RTX 4090なんてのも
これはGeforce RTX 4090の搭載メモリを標準の24GBよりも増やしたものや
安定動作を目的としてノイズ度外視で冷却機能や電気周りを強化したもの
ノートPC向けのRTX4090 Mobileをベースにしたものなどetc
ホントかウソか96GBに増やした製品もあるとも
これらの改造されたビデオカードのほとんどは深圳から出荷されていて
華強北のいくつかの店舗では実際に一括で改造して外部に販売されていることが確認できる
改造版は排熱強化のため騒音は個人の部屋では我慢できないほど大きい?
その元となるGeforce RTX 4090搭載カードは日本でも値上がりしており
以前は¥20万台だったものが¥40万超えするなどしている
先に秋葉原での騒動が報道されたような、日本で買って中国で売って一儲けしようとする行動が値段高騰の一因?
魔改版・満血版・蒸留版を問わず、その価格は馬鹿にならない
パーツの相性もあるし製品は大量の処理をする必要があり
挿したけど動きませんでした、処理させたら動かなくなりました、残念でしたでは済まない
PC自作系のハードウェアに精通した人でないとリスキーなわけで
ここでも華強北の人々の出番となる
彼らはDeepSeek R1が安定して動作するGeforce RTX 4090製品を2枚刺したショップブランドPCを将来に渡るテクニカルサポート付きで販売している
真っ当なところではレノボやファーウェイなどのメーカーから
バイドゥやJD(京東)といったクラウド事業を持つ企業
LLM開発企業、通信キャリアなど100社を超える企業が大模型(LLM)一体機と呼ばれるサーバー型ハードウェアを発表している
また医療、高等教育、政務、金融といった特定の業界に特化してサービスを提供する企業も大模型一体機をリリース
もともとLLMを活用していた企業がDeepSeek入りの安価な大模型一体機に移行しようと購入するケースと
自社のビジネスに対応できるかとりあえず導入してみようと購入いうケースのどちらもよくあるようだ
DeepSeekが中国で日々話題になった結果
テックファンやファーストユーザーが食いついただけではなく
法律や会計事務所などテクノロジーにあまり詳しくないビジネスユーザーも投資の費用対効果はすこぶるいいんじゃないかとお試しで導入を進めている
安さとパフォーマンスからDeepSeekを使おうというニーズが高まり
DeepSeek入りオールインワンのサーバーが続々と登場
DeepSeekが台頭すれば、今後出てくるLLMはDeepSeekを意識するわけで
アリババがパラメーター数が大幅に少ないにもかかわらず、DeepSeekと同等の性能を達成したという推論モデルQwQ-32Bを公開
より軽量動作で魅力的なLLMが登場すれば、導入に関心がもたれてそれに合わせた安価なハードウェアも登場し競争が発生することだろう
今後Geforce RTX 5090製品が流通して買いやすくなれば、マイニングが禁止になった後に中古ビデオカードが大量に売りに出されたように
激しく使い込まれたGeforce RTX 4090製品が中古市場に流れるかも・・・
で
DeepSeekにほぼ並ぶ性能を実現したオープンソースのAIモデルQWQ-32BをQwenが公開
誰でも無料で動かせるデモページも公開中
Open source AI softwareAI-powered financial planning app
Alibaba CloudのAI研究チームであるQwen
320億パラメーターのモデルでありながら6710億パラメーターのDeepSeek-R1と同等の性能を持つと
Qwenの研究チームは広範な世界知識で事前トレーニングを施した基盤モデルに対し強化学習を適用したとのこと
まず数学とコーディングタスクに特化して強化学習を行い
続いて一般的な機能用の強化学習を別のステージで行うことで数学とコーディングのパフォーマンスを高めたまま一般的なタスクもこなせるようになったそう
Qwenの研究チーム「強化学習の計り知れない可能性を目の当たりにした」
次世代のQwenの開発について「より強力な基礎モデルと強化学習を組み合わせる事で人工汎用知能(AGI)の実現に近づけることを確信している」
・・・早!
どれだけモノになるのか?
今日は~
流木着け だけど
その流木の下が欠けた
やぶん支障はない?
このママ様子見
0 件のコメント:
コメントを投稿