AI・GPU用語集|たとえ話で小学生にもわかる73語

AI・GPUサーバーの比較で出てくる専門用語を、小学生にもわかるたとえ話付きで解説。GPUの選び方やAIモデルのスペックの読み方がわかるようになります。

全73用語収録(2026年5月更新)

🔍 73語 表示中

🖥️ GPU・ハードウェア13語

🎮

GPU

ジーピーユー
AI計算を超高速で処理するプロセッサ
💬
たとえるなら たくさんの計算ドリルを一度に解ける100人の小学生チーム
Graphics Processing Unitの略。もともとはゲームの映像処理用ですが、大量の計算を同時に処理できる能力がAIの学習・推論に最適。NVIDIA社の製品が業界標準で、AIサーバー選びではGPUの性能が最重要です。
🧑‍💼

CPU

シーピーユー
パソコンの頭脳。汎用的な処理を担当
💬
たとえるなら 何でもできる優秀な1人の社員。仕事は正確だけど1人だと遅い
Central Processing Unitの略。パソコン全体の司令塔として、あらゆる処理をこなします。ただし、AI計算のような同じ計算を大量に繰り返す処理はGPUのほうが圧倒的に高速です。AIサーバーではGPUの補助役です。
📦

VRAM(ビデオメモリ)

ブイラム
GPU専用メモリ。AIモデルの大きさに直結
💬
たとえるなら 作業机の広さ。机が狭いと大きな模造紙は広げられない
GPUが直接アクセスする専用メモリ。AIモデルはVRAM上に展開されるため、VRAM容量=扱えるモデルの大きさです。Stable Diffusionには8GB以上、LLMの70Bモデルには80GB以上必要。GPU選びではまずVRAMを確認しましょう。
🗄️

メモリ(RAM)

メモリ / ラム
CPU用の作業メモリ。データの一時置き場
💬
たとえるなら 勉強するときの本棚。よく使う本をすぐ取れる場所に置く棚
CPUが処理中のデータを一時的に保管するメモリ。VRAMとは別物で、CPU側の処理に使います。AIサーバーでは16GB以上が推奨。データの前処理やモデルの読み込み時に使われます。
💾

SSD

エスエスディー
高速なデータ保存装置
💬
たとえるなら 本の取り出しが超速い図書館の書庫
Solid State Driveの略。従来のHDD(ハードディスク)より数倍高速にデータを読み書きできます。AIモデルのファイルは数GB〜数十GBあるため、SSDならモデルの読み込み時間を大幅に短縮できます。

NVMe

エヌブイエムイー
SSDの超高速接続規格。通常の5〜10倍速い
💬
たとえるなら 普通の道路と高速道路くらいの速さの差
Non-Volatile Memory Expressの略。SSDの中でも特に高速な接続規格で、従来のSATA SSDの5〜10倍の転送速度を実現します。大容量AIモデルを扱うなら必須。GPUSOROBANやエックスサーバーはNVMe SSD採用です。
📊

TFLOPS

テラフロップス
GPU性能の単位。1秒に1兆回の計算能力
💬
たとえるなら 1秒間に計算ドリルを1兆問解ける速さ
1 TFLOPSは1秒間に1兆回の浮動小数点演算ができることを意味します。GPU選びではFP16(半精度)のTFLOPS値が重要。例:A100は312 TFLOPS、H100は989 TFLOPS。数値が大きいほど高速です。
🚿

帯域幅(メモリ帯域)

たいいきはば
データの転送速度。太いほど高速
💬
たとえるなら 水道管の太さ。太いほど一度にたくさんの水が流れる
GPUとVRAM間のデータ転送速度のこと。単位はGB/s。帯域幅が広いほど大量のデータを高速にやり取りでき、LLMの推論速度に大きく影響します。H100は3.35TB/s、A100は2TB/sの帯域幅を持ちます。
🔌

消費電力(TDP)

しょうひでんりょく
GPUが使う電力量。ランニングコストに直結
💬
たとえるなら エアコンの電気代。パワーが強いほど電気をたくさん使う
GPUが動作時に消費する最大電力(ワット数)。消費電力が高い=電気代が高いため、長時間運用ではコストに直結します。H100は700W、L4は72Wと大きな差があり、用途に合ったGPU選びが重要です。
💚

NVIDIA

エヌビディア
AI向けGPU市場で圧倒的シェアの半導体メーカー
💬
たとえるなら AI世界のトヨタ。GPUといえばNVIDIA
AI用GPU市場で90%以上のシェアを持つ半導体メーカー。A100、H100、L4、RTXシリーズなど幅広いGPUを提供。CUDAプラットフォームと合わせて、AI開発の事実上の標準です。
🔴

AMD

エーエムディー
NVIDIAのライバル。Instinct/Radeonシリーズ
💬
たとえるなら NVIDIAが王者なら、AMDは挑戦者
NVIDIAに次ぐGPUメーカー。AI向けにInstinct MI300Xなどを展開中ですが、ソフトウェアエコシステム(CUDA相当のROCm)の成熟度ではまだNVIDIAに差があります。コスパ重視の選択肢として注目されています。
⚙️

CUDAコア

クーダコア
NVIDIA GPUの基本的な計算ユニット
💬
たとえるなら 工場の作業員。人数(コア数)が多いほど生産力アップ
NVIDIA GPU内部の演算ユニット。数千個のCUDAコアが並列に動作して大量の計算を同時処理します。コア数が多いほど基本的な演算能力が高くなります。ただしAI処理では、より専門的なTensorコアが重要です。
🧮

Tensorコア

テンサーコア
AI計算に特化した専用の計算ユニット
💬
たとえるなら 普通の作業員(CUDAコア)に加えたAI専門のスペシャリスト
NVIDIAがAI計算を高速化するために設計した専用ユニット。行列演算(AIの計算の基本)をCUDAコアの数倍〜数十倍の速さで処理します。A100以降のデータセンター向けGPUには大量のTensorコアが搭載されています。

🧠 AI基礎11語

🤖

AI(人工知能)

エーアイ / じんこうちのう
人間の知能をコンピュータで再現する技術
💬
たとえるなら 自分で考えて答えを出せるロボット
Artificial Intelligenceの略。画像認識、言語理解、ゲーム攻略など、従来は人間にしかできなかった知的な処理をコンピュータに行わせる技術の総称です。機械学習やディープラーニングはAIを実現する手法の一つです。
📚

機械学習

きかいがくしゅう
データからパターンを自動で見つける技術
💬
たとえるなら 何百枚も犬の写真を見て「犬の特徴」を自分で覚えること
Machine Learningの略。大量のデータを分析して、パターンやルールを自動的に学習する技術。人間がルールを一つ一つプログラムする必要がないのが特徴です。教師あり学習・教師なし学習・強化学習などの手法があります。
🧬

ディープラーニング

ディープラーニング
脳の仕組みを参考にした高度な機械学習
💬
たとえるなら 何層にも重ねたフィルターで情報をどんどん細かく理解する
深層学習とも呼ばれ、ニューラルネットワークを多層に重ねた機械学習手法。画像認識・音声認識・自然言語処理で飛躍的な成果を上げています。ChatGPTやStable Diffusionもディープラーニングの産物。GPUが不可欠です。
🕸️

ニューラルネットワーク

ニューラルネットワーク
人間の脳の神経回路を模した計算モデル
💬
たとえるなら 伝言ゲームのように、情報を次々と加工して答えにたどり着く仕組み
人間の脳の神経細胞(ニューロン)のつながりを模倣した数学モデル。入力層・中間層・出力層から成り、層を深くしたものがディープラーニング。画像や言語のパターンを学習するために使われます。
👨‍🏫

教師あり学習

きょうしありがくしゅう
正解データ付きで学習する方法
💬
たとえるなら 答え付きの問題集で勉強するようなもの
入力データと正解ラベルのペアを大量に与えて学習する手法。例:猫の画像に「猫」というラベルを付けて学習させる。分類や予測タスクに適しています。画像認識や迷惑メール判定などに広く使われます。
🔍

教師なし学習

きょうしなしがくしゅう
正解なしでデータの構造やパターンを発見
💬
たとえるなら 答えなしで、似た問題を自分でグループ分けするようなもの
正解ラベルなしのデータからパターンや構造を自動で見つける手法。クラスタリング(分類分け)や次元削減に使われます。顧客の購買パターン分析や異常検知などに活用されます。
🎮

強化学習

きょうかがくしゅう
試行錯誤で最適な行動を学ぶ方法
💬
たとえるなら ゲームを何度もプレイして、高得点の取り方を自力で覚える
AIが環境の中で行動し、報酬(ごほうび)を最大化するように学習する手法。囲碁AI「AlphaGo」やロボット制御で有名です。ChatGPTの回答品質向上にも「RLHF(人間のフィードバックによる強化学習)」が使われています。
💬

自然言語処理(NLP)

しぜんげんごしょり / エヌエルピー
人間の言葉をAIに理解させる技術
💬
たとえるなら 外国語を理解して翻訳してくれる通訳さん
Natural Language Processingの略。人間の言語(日本語、英語など)をコンピュータに理解・生成させる技術分野。翻訳、要約、感情分析、チャットボットなどに使われます。ChatGPTやClaudeはNLPの最先端です。
👁️

コンピュータビジョン

コンピュータビジョン
画像や映像をAIに理解させる技術
💬
たとえるなら AIに「目」を持たせて、写真の中身を理解させること
画像・映像から情報を抽出・理解するAI技術。物体検出、顔認識、自動運転などに活用されます。ディープラーニングの発展で精度が飛躍的に向上し、スマホの顔認証や監視カメラの分析に使われています。
🎭

マルチモーダルAI

マルチモーダルエーアイ
テキスト・画像・音声など複数の情報を扱えるAI
💬
たとえるなら 文章も絵も音楽もわかるオールラウンダーな先生
テキスト、画像、音声、動画など複数の種類のデータを同時に理解・生成できるAI。GPT-4oやClaude 3.5は画像を理解でき、Geminiは動画も扱えます。今後のAIの主流になると考えられています。
🌐

AGI(汎用人工知能)

エージーアイ
人間と同等の知能を持つ究極のAI
💬
たとえるなら どんな教科も人間と同じように考えられるスーパーAI
Artificial General Intelligenceの略。現在のAIは特定のタスクに特化していますが、AGIはあらゆる知的タスクを人間レベルでこなせるAI。まだ実現していませんが、OpenAI・Google・Anthropicが開発を目指しています。

📝 生成AI13語

生成AI(Generative AI)

せいせいエーアイ
テキスト・画像・音声などを新しく作り出すAI
💬
たとえるなら お題を出すと絵や文章を自分で考えて作ってくれるロボット
既存のデータを分析するだけでなく、新しいコンテンツを「生成」できるAIの総称。ChatGPTによる文章生成、Stable Diffusionによる画像生成、Sunoによる音楽生成などが代表的。2022年以降に爆発的に普及しました。
📖

LLM(大規模言語モデル)

エルエルエム
ChatGPTのような超大規模テキストAI
💬
たとえるなら 世界中の本を読んだ超物知りな図書館員
Large Language Modelの略。数十億〜数千億のパラメータを持ち、テキスト生成・翻訳・要約・コード生成が可能。代表例:GPT-4、Claude、LLaMA、Mistral。オープンソースLLMを自前GPUサーバーで動かせばAPI料金なしで利用できます。
🎨

Stable Diffusion

ステーブル ディフュージョン
テキストから画像を生成するオープンソースAI
💬
たとえるなら 言葉で伝えるだけで絵を描いてくれる画家ロボット
Stability AI社が開発した画像生成AI。テキストプロンプトを入力するだけで高品質な画像を生成。オープンソースのため自前GPUサーバーで無料・無制限に使えます。VRAM 8GB以上のGPUが必要です。
🖼️

FLUX

フラックス
Stable Diffusionの次世代。より高品質な画像生成
💬
たとえるなら Stable Diffusionの進化版。特に人の顔や手がうまい
Black Forest Labs社が開発した最新の画像生成モデル。Stable Diffusionより高品質で、人物の手や顔の描画精度が大幅に向上しています。ただしモデルサイズが大きく、VRAM 24GB以上のGPUが推奨されます。
🌄

Midjourney

ミッドジャーニー
アート品質が高いクラウド型画像生成AI
💬
たとえるなら プロの画家が描いたような絵を作ってくれるサービス
Discord上で利用できる画像生成AIサービス。芸術的で美しい画像が生成できるのが特徴。クラウドサービスのため自前のGPUは不要ですが、月額制で利用回数に制限があります。商用利用も可能(有料プラン)。
🎪

DALL-E

ダリ
OpenAIが開発した画像生成AI
💬
たとえるなら ChatGPTの仲間で、絵を描くのが得意なAI
OpenAI社が開発した画像生成AI。ChatGPT Plus(有料版)から利用できます。テキスト描画の精度が高く、看板やロゴ入り画像の生成に強みがあります。APIからも利用可能です。
💭

ChatGPT

チャットジーピーティー
OpenAI社の対話型AI。生成AIブームの火付け役
💬
たとえるなら 何でも質問に答えてくれる超賢い相談相手
OpenAI社が開発した対話型AIサービス。GPT-4をベースに、質問応答・文章作成・コード生成・画像生成など幅広いタスクに対応。2022年11月の公開後、わずか2ヶ月で1億ユーザーを突破しました。
🟠

Claude

クロード
Anthropic社の対話型AI。長文理解に強い
💬
たとえるなら 長い文章を全部読んで正確に答えてくれる読書家AI
Anthropic社が開発した対話型AI。最大100万トークンの超長文を理解でき、安全性への配慮が特徴。Claude 3.5 Sonnetはコーディング能力が非常に高く、開発者からの支持も厚いモデルです。
✏️

プロンプト

プロンプト
AIへの指示文。出力の品質を左右する
💬
たとえるなら 料理の注文書。注文が具体的なほど思い通りの料理が出てくる
AIに対する入力テキスト(指示文)のこと。プロンプトの書き方で出力の品質が大きく変わるため、「プロンプトエンジニアリング」という専門分野もあります。画像生成では描きたい内容を英語で詳細に記述します。
🚫

ネガティブプロンプト

ネガティブプロンプト
「これは描かないで」とAIに伝える指示
💬
たとえるなら 「ピーマン抜きで」のように、要らないものを伝える注文
画像生成AIで「生成してほしくない要素」を指定するテキスト。例:「low quality, blurry, extra fingers」(低品質、ぼやけ、余分な指)を指定すると、それらを避けた画像が生成されます。品質向上に効果的です。
🧩

トークン

トークン
AIがテキストを処理する最小単位
💬
たとえるなら 文章を細かく切ったパズルのピース。1単語が1〜3ピース
LLMがテキストを処理する際の最小単位。英語では1単語≒1トークン、日本語では1文字≒1〜3トークンになります。API料金はトークン数で課金され、モデルの入出力上限もトークン数で表されます。
🔄

Transformer

トランスフォーマー
現代AIの基盤となるアーキテクチャ
💬
たとえるなら 文章全体を一度に見渡して、大事な部分に注目できる仕組み
2017年にGoogleが発表した「Attention Is All You Need」論文で提案されたモデル構造。文脈を広く捉える「注意機構(Attention)」が特徴で、GPT、BERT、Stable Diffusionなど現代の主要AIモデルの基盤です。
🌫️

拡散モデル(Diffusion Model)

かくさんモデル
ノイズから画像を生成するAI技術
💬
たとえるなら 砂嵐のテレビ画面から、少しずつキレイな絵が浮かび上がる感じ
画像にノイズ(ザラザラ)を加える過程を学習し、逆にノイズから画像を復元することで画像を生成する技術。Stable DiffusionやFLUX、DALL-Eの基盤技術です。高品質で多様な画像を生成できます。

⚙️ 学習・チューニング12語

🏋️

学習(Training)

がくしゅう / トレーニング
AIにデータを与えてパターンを覚えさせること
💬
たとえるなら 何百問もの問題を解いて、解き方のコツを身につける勉強期間
AIモデルに大量のデータを与え、パターンを学ばせるプロセス。大量のGPU・時間・データが必要で、大規模LLMの学習には数千万〜数億円のコストがかかります。学習済みモデルを使う「推論」とは区別されます。
💡

推論(Inference)

すいろん
学習済みAIで予測や生成を実行すること
💬
たとえるなら 勉強で覚えたことを使って、テストの問題を解くこと
学習済みモデルを使って新しいデータを処理する段階。画像生成やチャットAIの応答は全て推論です。推論は学習より必要GPUスペックが低いのが特徴で、初心者はまず推論から始めるのがおすすめです。
🎯

ファインチューニング

ファインチューニング
既存AIを特定の用途に合わせて追加学習
💬
たとえるなら 英語が得意な人に、医療英語をさらに勉強させるイメージ
事前学習済みの汎用モデルに特定のデータで追加学習を行い、特定タスクに特化させる手法。ゼロから学習するより少ないデータ・時間で済みます。推論だけの場合より2〜3倍のVRAMが必要になります。
🔗

LoRA

ローラ
少ないリソースでAIをカスタマイズする技術
💬
たとえるなら 制服の上にアクセサリーだけ付け替えてイメチェンする方法
Low-Rank Adaptationの略。モデル全体を再学習するのではなく、小さなパラメータだけを追加・学習させます。少ないVRAM・短い時間でモデルをカスタマイズ可能。Stable Diffusionの画風調整によく使われます。
🔧

フルファインチューニング

フルファインチューニング
モデル全体のパラメータを再学習する手法
💬
たとえるなら 制服を全部仕立て直すようなもの。手間はかかるが完璧に合う
LoRAと違い、モデルの全パラメータを更新するファインチューニング。最高の品質が得られますが、大量のVRAMと時間が必要です。7Bモデルでも80GB以上のVRAMが推奨されるため、H100クラスのGPUが必要です。
🔀

転移学習

てんいがくしゅう
別タスクで学んだ知識を新しいタスクに活用
💬
たとえるなら サッカーで鍛えた体力を、バスケでも活かすようなもの
あるタスクで学習したモデルの知識を、別のタスクに転用する学習手法。ゼロから学習するより高精度・短時間で結果が出ます。ファインチューニングも転移学習の一種で、現代のAI開発では基本的な手法です。
🔁

エポック

エポック
データセット全体を1回学習すること
💬
たとえるなら 問題集を最初から最後まで1回解き終わること=1エポック
学習データ全体を1回通して学習するサイクルを1エポックと言います。通常は数十〜数百エポック繰り返して学習を進めます。エポック数が多すぎると過学習になるため、適切な数の設定が重要です。
📦

バッチサイズ

バッチサイズ
一度に処理するデータの個数
💬
たとえるなら 一度に何枚のプリントを採点するか決める数
1回の学習ステップで処理するデータの数。バッチサイズを大きくすると学習が安定・高速になる反面、VRAMを多く消費します。VRAMが足りない場合はバッチサイズを小さくして対応します。
📐

学習率

がくしゅうりつ
AIが1回の学習でどれだけ修正するかの度合い
💬
たとえるなら 歩幅の大きさ。大きすぎると通り過ぎ、小さすぎると進まない
モデルのパラメータをどれだけ更新するかを制御する値。大きすぎると学習が不安定に、小さすぎると学習が遅くなります。一般的に0.001〜0.0001程度が使われ、学習の進行に合わせて変化させることもあります。
📝

過学習(Overfitting)

かがくしゅう
学習データを丸暗記して応用がきかなくなる状態
💬
たとえるなら 教科書の答えは全部覚えたけど、初めての問題が解けない状態
学習データに対しては高精度だが、未知のデータに対応できなくなる現象。エポック数が多すぎたり、データが少なすぎると発生します。データの増量、早期停止、ドロップアウトなどで対策します。
📂

データセット

データセット
AIの学習に使うデータの集まり
💬
たとえるなら 先生が用意した大量の問題プリント集
AI学習に使うデータの集合。画像認識なら画像+ラベル、LLMなら大量のテキスト。データの品質と量がAIの性能を大きく左右します。ImageNet(画像)、Common Crawl(テキスト)などの公開データセットもあります。
🏷️

アノテーション

アノテーション
データに正解ラベルを付ける作業
💬
たとえるなら 写真1枚1枚に「これは犬」「これは猫」と付箋を貼る作業
学習データに正解情報(ラベル)を付与する作業。画像に「猫」とタグ付けしたり、テキストの感情を「ポジティブ」と分類したり。教師あり学習には必須の工程で、大量のデータに対して行うため時間とコストがかかります。

📦 モデル・フォーマット10語

🔢

パラメータ

パラメータ
AIモデルの「知識量」。7B=70億個
💬
たとえるなら 脳の神経のつながりの数。多いほど賢いけど場所を取る
AIモデルが学習で獲得した数値の集合。パラメータ数が多いほど賢くなるが、必要なVRAMも増加。7B(70億)は16GB、70B(700億)は80GB以上のVRAMが必要(FP16の場合)。用途に合ったサイズ選びが重要です。
🗜️

量子化(Quantization)

りょうしか
モデルを圧縮して少ないVRAMで動かす技術
💬
たとえるなら 高画質の写真を軽いJPEGに圧縮するようなもの
AIモデルの数値精度を下げてサイズを削減する技術。FP16を4ビットに量子化するとサイズが約1/4に。70Bモデルでも量子化すればVRAM 24GBで推論可能(品質はやや低下)。GGUF形式やAWQ形式が代表的です。
📄

GGUF

ジージーユーエフ
CPU/GPUで効率的にLLMを動かすファイル形式
💬
たとえるなら どのパソコンでも再生できるMP4のような汎用フォーマット
llama.cppで使われるモデルフォーマット。CPU推論にも対応しており、GPUがなくてもLLMを動かせます(速度は遅い)。量子化モデルの配布に広く使われ、Hugging Faceで多数のGGUFモデルが公開されています。
🔌

ONNX

オニキス
AIモデルの共通フォーマット。異なる環境で動作
💬
たとえるなら どのメーカーのプリンターでも使えるUSBケーブル
Open Neural Network Exchangeの略。PyTorchやTensorFlowなど異なるフレームワーク間でモデルを共有するための標準形式。推論の最適化にも使われ、ONNX Runtimeで高速に推論を実行できます。
🔒

SafeTensors

セーフテンサーズ
安全で高速なAIモデルの保存形式
💬
たとえるなら ウイルスが入り込めない安全な保存箱
Hugging Faceが開発した安全なモデルフォーマット。従来のpickle形式と違い、悪意あるコードが混入できない設計で安全。読み込みも高速で、Stable DiffusionやLLMのモデル配布で標準になりつつあります。
📏

FP16/FP32/INT8

エフピー16 / 32 / イントエイト
数値の精度。精度が低いほど軽くて速い
💬
たとえるなら 小数点以下何桁まで計算するかの違い
FP32(32ビット浮動小数点)は高精度だが重い、FP16(16ビット)は精度を少し落として速度2倍・メモリ半分。INT8(8ビット整数)はさらに軽量。AI推論ではFP16が主流で、量子化ではINT8/INT4も使われます。
💾

チェックポイント

チェックポイント
学習途中のモデルを保存したファイル
💬
たとえるなら ゲームの「セーブデータ」。途中から再開できる
学習の途中段階でモデルの状態を保存したファイル。学習が途中で止まっても、チェックポイントから再開できます。Stable Diffusionでは完成したモデルのことも「チェックポイント」と呼びます(.ckpt/.safetensors形式)。
🧬

モデルマージ

モデルマージ
複数のAIモデルを合体させて新しいモデルを作る
💬
たとえるなら 2つのカレールーを混ぜて、オリジナルの味を作るようなもの
複数の学習済みモデルのパラメータを混合して新しいモデルを作る手法。追加の学習なしで各モデルの長所を組み合わせられます。Stable Diffusionのコミュニティで盛んに行われ、CivitAIなどで共有されています。
🏗️

ベースモデル

ベースモデル
ファインチューニング前の基本モデル
💬
たとえるなら トッピング前のプレーンなピザ生地
大量のデータで事前学習された汎用モデル。ここからファインチューニングで用途に合わせてカスタマイズします。LLaMA、Mistral、SDXLなどがベースモデルとして広く使われています。
🌍

オープンソースモデル

オープンソースモデル
無料で使える公開AIモデル
💬
たとえるなら レシピが公開されていて、誰でも作れる料理
モデルの重み(パラメータ)が公開されており、誰でも無料でダウンロード・利用できるAIモデル。LLaMA、Mistral、Stable Diffusionが代表的。自前のGPUサーバーで動かせばAPI料金なしで使い放題です。

🔧 サーバー・インフラ14語

🖥️

GPU VPS

ジーピーユー ブイピーエス
GPU付きのレンタルサーバー。AI処理が可能
💬
たとえるなら 高性能パソコンを時間制でレンタルするサービス
VPS(仮想専用サーバー)にGPUを搭載したサービス。従量課金(時間単位)が一般的で、使った分だけ支払います。国内ではGPUSOROBAN、XServer VPS for GPU、ConoHa VPS GPUなどが代表的です。
☁️

クラウドGPU

クラウドジーピーユー
インターネット経由で使えるGPU計算環境
💬
たとえるなら 遠くの工場の機械を、ネット経由でリモート操作するイメージ
クラウド上のGPUリソースをインターネット経由で利用するサービス。初期投資不要で、必要なときだけGPUを使えるのが利点。AWS、GCP、Azure、Vast.aiなどが提供。GPU VPSもクラウドGPUの一種です。
🏢

オンプレミス

オンプレミス
自前でGPUマシンを購入・運用する形態
💬
たとえるなら レンタカーではなく、自分の車を買って使うこと
自社でGPU搭載マシンを購入・設置・管理する運用形態。長期的にはコスト安ですが、初期投資(H100は400万円以上)、電気代、保守が必要。月200時間以上GPUを使うならクラウドより有利になる場合があります。
🐳

Docker

ドッカー
アプリの実行環境をパッケージ化する技術
💬
たとえるなら お弁当箱。必要なおかずが全部入っていて、どこでも食べられる
AI実行に必要なソフトウェア(Python、PyTorch、CUDA等)を全て含んだ「コンテナ」を1コマンドで起動できます。環境構築の手間がなくなり、「手元では動くがサーバーでは動かない」問題を防げます。
📦

コンテナ

コンテナ
アプリとその動作環境をまとめた軽量パッケージ
💬
たとえるなら 引っ越し用コンテナ。中身ごとどこにでも運べる箱
アプリケーションとその依存環境を丸ごとパッケージ化した実行単位。Dockerが代表的なコンテナ技術です。仮想マシンより軽量で起動が速く、AIの実行環境として広く使われています。

CUDA

クーダ
NVIDIA GPU上でAI計算を行うプラットフォーム
💬
たとえるなら NVIDIAのGPUを動かすための「運転免許」のようなもの
NVIDIAが提供するGPU向け並列計算プラットフォーム。PyTorchやTensorFlowは内部でCUDAを使いGPU計算を実行します。AI開発でNVIDIA GPUが標準となっている最大の理由がCUDAエコシステムの存在です。
🔥

PyTorch

パイトーチ
最も広く使われるAI開発フレームワーク
💬
たとえるなら AIを作るための最強の工具セット
Meta(旧Facebook)が開発したPython用の機械学習ライブラリ。Stable Diffusion、LLaMA、Mistralなど主要AIモデルのほとんどがPyTorchで開発されています。GPUサーバーではPyTorch + CUDAのセットアップが基本です。
🧮

TensorFlow

テンサーフロー
Googleが開発したAIフレームワーク
💬
たとえるなら PyTorchのライバル。Google製の工具セット
Googleが開発したオープンソースの機械学習フレームワーク。本番環境へのデプロイに強みがあります。近年はPyTorchに押され気味ですが、Google Cloud上での利用やモバイルAI(TensorFlow Lite)で根強い人気があります。
🐍

Python

パイソン
AI開発で最も使われるプログラミング言語
💬
たとえるなら AI世界の「共通語」。AIをやるならまずPython
シンプルな文法で初心者にも学びやすいプログラミング言語。PyTorch、TensorFlow、Hugging Faceなど主要AIライブラリは全てPython対応。AI開発では事実上の標準言語で、GPUサーバー上でPythonスクリプトを実行します。
🔑

SSH

エスエスエイチ
サーバーに安全にリモート接続する仕組み
💬
たとえるなら 遠くのパソコンを手元から安全に操作する「リモコン」
Secure Shellの略。GPU VPSにはSSHで接続してコマンドを実行します。Windowsでは「PowerShell」、Macでは「ターミナル」から ssh username@IPアドレス で接続。初めてでも10分程度で接続可能です。
🔗

API

エーピーアイ
ソフトウェア同士をつなぐ窓口
💬
たとえるなら レストランの注文窓口。メニューから頼むと料理が出てくる
Application Programming Interfaceの略。OpenAIやAnthropicはAPIを通じてAIモデルを提供しています。自分のアプリからAPIを呼び出すことで、ChatGPTやClaudeの能力を組み込めます。利用量に応じた従量課金が一般的です。
💰

スポットインスタンス

スポットインスタンス
空きGPUを割安で使えるが中断の可能性あり
💬
たとえるなら キャンセルが出たホテルの部屋を格安で使えるけど、急に退室もある
クラウドのGPUに空きが出た際に通常より大幅に安い料金で利用できるプラン。ただし他の利用者が来ると途中で中断される可能性あり。Vast.aiのInterruptibleプランが代表的。推論や実験用途なら大幅コスト削減できます。
🔗

マルチGPU

マルチジーピーユー
複数のGPUを同時に使って処理を高速化
💬
たとえるなら 1人では重い荷物を、2人で持てば楽に運べるのと同じ
複数のGPUを連携させて計算を分担する構成。70B以上の大規模LLMの学習や推論ではマルチGPU構成が必須です。NVLinkやNVSwitchで高速接続されたGPU同士で効率的にデータをやり取りします。
🌐

分散学習

ぶんさんがくしゅう
複数のマシンやGPUで学習を分担・高速化
💬
たとえるなら クラス全員で分担して百科事典を読むようなもの
大規模AIモデルの学習を複数のGPU/マシンに分散して行う手法。データ並列(同じモデルで別データ)モデル並列(モデルを分割)の2種類があります。GPT-4クラスの学習には数千GPU規模の分散学習が行われています。

GPUサーバーを比較する

用語がわかったら、実際のGPUサーバーの料金・スペックを比較してみましょう。

AI・GPUサーバー比較ページへ »