AI用語集
「これってどういう意味?」を解決。基本から最新トレンドまで徹底解説。
🔰 AIの基礎・概念
AI (Artificial Intelligence / 人工知能) 基礎
人間の知能(学習、推論、認識、判断など)をコンピュータ上で模倣・再現する技術の総称。
現在主流の「特化型AI (ANI)」は特定のタスク(将棋、画像認識、会話)に優れていますが、人間のようにあらゆる問題を解決できる「汎用人工知能 (AGI)」はまだ実現していません。
機械学習 (Machine Learning) 基礎
AIを実現するための核心技術。コンピュータに大量のデータを与え、そこに潜む「ルール」や「パターン」を自動的に学習させる手法です。
人間が手動でプログラムを書くのではなく、データからプログラム(モデル)を自動生成するイメージです。
ディープラーニング (Deep Learning / 深層学習) 重要
機械学習の一種で、人間の脳の神経回路(ニューラルネットワーク)を模した構造を多層に重ねたもの。現在のAIブームの立役者。
画像認識、音声認識、自然言語処理など、従来の手法では難しかった複雑なパターンの認識が可能になりました。
シンギュラリティ (技術的特異点) 概念
AIが人間の知能を超越し、AI自身がより賢いAIを作り出すようになる転換点のこと。レイ・カーツワイル氏は2045年頃と予測していましたが、最近の進化速度から「もっと早いのでは?」という議論も活発です。
チューリング・テスト 歴史
「機械は思考できるか?」を判定するためのテスト。人間が画面越しに会話を行い、相手が人間か機械か見分けがつかなければ「合格」とされます。現在のLLMは容易に合格するレベルに達しています。
🎨 生成AI・LLM
生成AI (Generative AI) トレンド
学習データをもとに、新しいオリジナルデータ(テキスト、画像、音声、動画、コード)を創造できるAI。
「予測」や「分類」だけでなく、「創造」ができる点が革命的でした。
LLM (Large Language Model / 大規模言語モデル) 最重要
WEB上の膨大なテキストを学習し、言葉の意味や文脈を理解するAIモデル。ChatGPTやGeminiの頭脳にあたります。
「次に来る単語を確率的に予測する」という仕組みですが、規模が巨大化したことで論理的思考や推論のような能力を獲得しました(創発)。
ハルシネーション (Hallucination / 幻覚) 注意
生成AIが、事実とは異なるもっともらしい嘘を出力してしまう現象。
AIは「事実」を知っているわけではなく、「文脈的に自然な言葉」を選んでいるだけなので、存在しない論文や事件を捏造することがあります。必ずファクトチェックが必要です。
SLM (Small Language Model / 小規模言語モデル) トレンド
LLMを軽量化し、家庭用PCやスマホ(オンデバイス)でも動くようにしたモデル。「Gemini Nano」などが該当します。プライバシー保護や低遅延がメリットです。
⚙️ 技術・仕組み (RAG/Fine-tuning等)
RAG (Retrieval-Augmented Generation / 検索拡張生成) 実用
AIに社内ドキュメントや最新ニュースなどの「外部データ」を検索させ、その情報を元に回答させる技術。
LLM自体は学習時点までの知識しか持っていませんが、RAGを使うことで「昨日のニュース」や「社外秘のマニュアル」に基づいた回答が可能になります。
ファインチューニング (Fine-tuning) 学習
既存のAIモデルに対して、特定のデータ(例:法律文書、医療データ、特定作家の小説)を追加で学習させ、その分野に特化させること。
「再学習」とも呼ばれ、特定の業務やキャラクターの口調を再現する際などに使われます。
トランスフォーマー (Transformer) 核心
2017年にGoogleが発表した深層学習モデル。「Attention(注意機構)」という仕組みを使い、文章中のどの単語が重要かを判断します。
現在のGPT (Generative Pre-trained Transformer) やBERTなど、ほぼ全ての高性能LLMのベースとなっている革新的な技術です。
トークン (Token) 単位
AIがテキストを処理する際の最小単位。英語では約1単語、日本語ではひらがな1文字〜漢字1文字程度が1トークン。
AIの利用料金や、「一度に読める量(コンテキストウィンドウ)」は文字数ではなくトークン数で計算されます。
パラメータ数 (Parameters) スペック
AIモデルの「脳細胞の結合」の数のようなもの。一般的にパラメータ数が多いほど、より複雑なことを理解し、賢くなりますが、動かすのに巨大な計算機が必要になります。
GPT-4などは数兆パラメータと言われていますが、最近は少なくても賢いモデルを作る技術も進んでいます。
🗣️ プロンプト技術
プロンプト (Prompt) 基礎
AIへの「指示書」のこと。「命令」だけでなく、前提条件や参考テキストを与えることも含みます。
プロンプトエンジニアリング スキル
AIから望む回答を引き出すために、指示の出し方を試行錯誤・設計するスキル。
「# 命令」「# 制約条件」「# 出力形式」と構造化して書く、役割を与える(ロールプレイ)、思考の過程を出力させる(CoT)などのテクニックがあります。
Few-Shot / Zero-Shot 中級
AIに例を見せる手法。例なしで頼むのが「Zero-Shot」、いくつか例を見せてパターンを学ばせるのが「Few-Shot」です。
難しいタスクでも、良い例を2〜3個見せるだけで精度が劇的に向上します。
CoT (Chain of Thought / 思考の連鎖) 応用
いきなり答えを出させるのではなく、「ステップバイステップで考えて」と指示することで、AIに思考プロセスを出力させる手法。
計算問題や論理的推論において、回答の精度が大幅に上がることが知られています。
🛠️ 代表的ツール・モデル
Gemini (ジェミニ) Google
Googleの最新マルチモーダルAI。Pro、Flash、Nanoなどのモデルがあり、Google Workspaceとの連携が強力。このサイトの共同制作者。
ChatGPT (チャットジーピーティー) OpenAI
対話型AIの代名詞。GPT-3.5, GPT-4oなどのモデルを使用。プラグイン機能やカスタム指示(GPTs)が豊富。
Claude (クロード) Anthropic
非常に自然で文学的な日本語を書くのが得意なAI。長文読解に優れています。開発元のAnthropicは「安全性」を最優先しています。
Microsoft Copilot MS
MicrosoftのAIアシスタント。中身はGPT-4ベース。WordやExcel、PowerPointに組み込まれており、仕事の自動化に強みを持ちます。
Perplexity (パープレキシティ) 検索
「検索エンジン」と「AIチャット」を融合させたサービス。質問するとWEBを検索し、出典元を明記して回答をまとめてくれます。
🖼️ 画像・動画・音楽生成
Stable Diffusion 画像
オープンソースの画像生成AI。自分のPCにインストールして使えるため、自由度が非常に高く、世界中で追加機能(LoRAなど)が開発されています。
Midjourney (ミッドジャーニー) 画像
圧倒的な芸術性とクオリティを誇る画像生成サービス。Discord上で操作します。写真のようなリアルな画像から、幻想的なアートまで得意です。
Sora (ソラ) 動画
OpenAIが発表した動画生成AI。テキストから最長1分の高品質な動画を生成でき、物理法則を理解しているかのようなリアルな動きが特徴です(執筆時点)。
Suno / Udio 音楽
テキストを入力するだけで、ボーカル入りの本格的な楽曲を生成できるAI。作詞・作曲・演奏・歌唱まですべてAIが行います。
⚠️ リスク・課題・倫理
ディープフェイク (Deepfake) リスク
深層学習(Deep Learning)を用いて偽造(Fake)された動画や音声。有名人の偽発言や、詐欺などに悪用されるリスクがあり、社会問題化しています。
バイアス (Bias) 偏見
AIの学習データに含まれる偏りが、出力結果に反映されてしまうこと。特定の人種や性別に対する差別的な回答をしてしまう問題などが指摘されています。
AIと著作権 法務
「学習段階」と「生成活用段階」で議論が分かれます。日本では学習利用は原則適法(著作権法30条の4)ですが、生成物が既存の著作物に酷似している場合は侵害となる可能性があります。
プロンプトインジェクション 攻撃
AIに対して特殊な命令を入力し、本来禁止されている回答(爆弾の作り方など)を引き出したり、内部情報を漏洩させたりするサイバー攻撃の一種。
💼 ビジネス・未来
DX (Digital Transformation) 経営
デジタル技術を使って、ビジネスや生活の形を変革すること。単なる「IT化」ではなく、AIなどを活用して「新しい価値を生む」ことがゴールです。
エージェンティック・ワークフロー 働き方
人間が作業工程を細かく管理するのではなく、AIエージェントに「目的」を与え、AI自身が計画・実行・修正を行う自律的な仕事の進め方のこと。2026年以降の主流になると言われています。
用語は随時追加していきます!
トップページに戻る