柳谷智宣のAI ウォッチ!

「Gemini CLI」のつかいかた ~非エンジニアでも怖くない! 黒い窓アレルギーを解消しよう

いま知っておきたいAIエージェントとMCP[前編]

 本連載「柳谷智宣のAI ウォッチ!」では、いま話題のAI(生成AI)を活用したサービスを中心に取り上げていく(基本的に1サービスにつき前後編を予定)。今回はGoogleのオープンソースAIエージェント「Gemini CLI」の使い方を紹介する。
オープンソースAIエージェント「Gemini CLI」が公開された

 2025年6月25日、オープンソースのAIエージェント「Gemini CLI」が発表された。Google Gemini APIを利用して、チャットAIをターミナル上で使えるCLI(Command Line Interface)ツールだ。

 コマンドラインインターフェイスの黒いウィンドウは、エンジニアでない多くの人にとって、専門家だけが使う謎めいたツールに見えていることだろう。たしかに、これまでのCLIは一般ユーザーにとって敷居が高かった。一文字でもタイプミスすれば動かないし、覚えるべきコマンドは膨大で、エラーメッセージは暗号のように難解だ。敬遠したくなるのは当然かもしれない。

 しかし、時代が変わろうとしている。

 生成AIの急激な進化により、「バイブコーディング(対話的プログラミング)」が現実のものとなってきた。エンジニアによるアプリ開発だけではない。デザイナーがAIと会話しながらコードを生成し、ライターが音声指示でデータを整理し、マーケターがAIツールを駆使して分析を行う、といった未来の仕事風景が実現しつつあるのだ。

 今回は、生成AIのGeminiが組み込まれた「Gemini CLI」の簡単な使い方を紹介する。非エンジニアの方でも最初の一歩を踏み出せるように詳しく紹介するのでまずは試してほしい。

 とはいえ、いきなりすごいアプリを開発しようとすると挫折する。AIを使うのも自転車と同じようなもので、乗ってみれば意外と簡単だし、乗り続ければすぐに上達する。エクセルで例えるなら、表の合計を出すようなレベルから始めよう。兎にも角にもまずは、触ってみてほしい。

無料でも意外と使える「Gemini CLI」、データの学習利用には注意

 「Gemini CLI」は、チャットボットのように単に質問に答えるだけではなく、AIエージェントとして機能する。与えられた目標を達成するために自ら計画を立て、行動することができるのだ。ファイルを読み書きする能力(ReadFile, WriteFile)やWebを検索する能力(GoogleSearch)、そしてPC上でコマンドを実行する能力(Shell)などをツールとして備えており、必要に応じて使い分けることができる。

 使い方も簡単だ。黒いウィンドウに日本語でやりたいことを入力するだけ。AIがその指示を最適なコマンドに翻訳し、実行してくれる。

 例えば、ファイルが散乱しているデスクトップで、Gemini CLIを実行し、「ファイルを適切なフォルダーに分類して」と指示するだけで、タスクを完了させてくれる。通常であれば、何十分もかかる作業が自動化できるのだ。Gemini CLIの便利さの一端が伝わるだろうか。

ごちゃごちゃしたデスクトップもあっという間に整理整頓してくれる

 Gemini CLIは、無料プランでもある程度がっつりと利用できるのが特徴だ。

 個人のGoogle アカウントでログインすれば、高性能な「Gemini 2.5 Pro」モデルを、1分あたり60回、1日あたり最大1,000回まで無料で利用できる。お試しという範疇を超えており、ユーザーとしてはありがたいところ。GoogleがAIエージェント市場の主導権を握るための戦略的な一手と考えてよいだろう。無料分を超えて使うなら、有料のAPIキーを利用する必要がある。

 ところで、Gemini CLIを利用する上で気になるのが、“入出力データをAIの学習に使われるかどうか”だろう。

 有料のAPIを利用したり、法人プランを利用する場合は学習に使われないので安心してよい。しかし、「無料プランは学習されてしまう」というのは覚えておきたいところ。一部の情報はオプトアウトできるが、すべての情報を完全に遮断することはできない。機密情報を扱うような場合は、有料プランを契約する必要があるだろう。

無料でも1日に1,000リクエスト利用できるので存分に試そう

まずは触ってみよう! 3ステップで始める「Gemini CLI」

1:Node.jsをインストールしよう

 まずは「Node.js」というプログラムを一度だけインストールする。

 これはアプリケーションを動かすための実行環境のようなものと考えればよい。公式Webサイトからインストールファイルをダウンロードして実行する。

「Node.js」をインストールする

2:Gemini CLIの初期設定をしよう

 Node.jsの準備ができたら「ターミナル」を起動する。

 Windowsのスタートメニューの検索フォームに「ターミナル」と入力すれば見つかるはずだ。黒い画面が出ても怖がらずに、以下のコマンドをコピペしよう。

npm install -g @google/gemini-cli

 これで、PCにGemini CLIを呼び出すための基本ツールがインストールされる。

 完了したら、「gemini」と入力することで、Gemini CLIを起動できるようになる。最初に好みの配色を選択し、次にログイン方法を選択するよう促される。

初回のみテーマを選択する

 ここで[Login with Google]を選択すると、自動的にWebブラウザーが開き、見慣れたGoogleのログイン画面が表示される。個人のGoogle アカウントで認証すると、Gemini CLIを利用できるようになる。ほかに、GeminiのAPIやGoogle Workspace アカウント、Vertex AIなどを利用することもできるが、ここでは割愛する。

今回は個人のGoogle アカウントでログインする

3:作業したいフォルダーから「ターミナル」を実行しよう

 ここで重要かつ初心者が理解しにくいポイントが「実行フォルダー」の概念だ。

 ターミナルは、部屋の中に立っている人間のようなものと考えてみよう。「この部屋の写真を整理して」と頼めば、その部屋の写真は整理できるが、隣の部屋には手が届かない。つまり、AIに何かを頼む前に、まず「どの部屋(フォルダー)で作業するのか」をターミナルに伝えなければならないのだ。

 散らかった「デスクトップ」で作業したい場合、Gemini CLIを起動する前に、まず「cd」コマンドでデスクトップフォルダーに移動する必要がある。面倒であれば、エクスプローラーで作業したいフォルダーを開き、右クリックメニューから「ターミナル」を実行すると、その場所でスタートできるので手間がかからない。

実行フォルダーの右クリックメニューから「ターミナル」を起動する

 これで準備完了。

 ターミナルには「>」というプロンプトが表示されるので、「gemini」と入力すると、Gemini CLIが起動する。

「Gemini CLI」を使ってみよう

 では、早速使ってみよう。

 今回はさまざまなファイルが乱雑に保存されているデスクトップを整理してみることにする。ファイル形式で分類するのは簡単だが、ファイル名などを見ながら適切なフォルダーに移動させるのは手間がかかる。そこで、以下のプロンプトを入力してみよう。

【プロンプト】

デスクトップにあるファイルをファイル名や内容から適切なフォルダーに整理してください。フォルダーは経理、開発、マーケティング、プロジェクト、分類不能の5つです。

 Geminiがプロンプトを分析し、自分が何をすべきなのかを考え、計画を立案。そしてフォルダーの作成から分類、ファイルの移動を開始する。時々うまくいかないことがあっても、その理由を考え、別の方法でチャレンジしていく。

 フォルダーを作成したり、ファイルを移動する際は、ユーザーに実行の確認を求めてくる。

 [Esc]キーを押せば「No」となり、操作をキャンセルできる。[Yes,allow once]を選ぶと、1度だけ実行を許可する。通常はこちらを利用しよう。[Yes,allow always "mkdir …"]を選ぶと、そのコマンドは許可なしで実行されるようになる。たしかに便利だが、AIがミスをする可能性もあるので、1回ずつ許可する方が安心だ。

 また、そのコマンドが何をするのかわからないなら、一度キャンセルして「これは何をしようとしている?」と聞くと教えてくれる。

ファイルやフォルダーを操作する際はユーザーの確認が必要

 今回は、100以上あるファイルのうち、なぜか5個だけ残ったので、残りも分類するように指示して完了。最後に1つだけ、作業用に生成したファイルを削除できなかったようで、「それは手動で削除してくれ」とお願いされてしまった。とはいえ、大量のファイルの分類を1分もかからずに、自動で処理できてしまった。

途中で終了してしまったので、最後まで処理するように追加指示した
きちんとファイル名を見て、適切なフォルダーに整理してくれた

 ごりごりと作業させていると、無料利用分の1,000回がなくなってしまうこともある。そんなときは「Gemini 2.5 Flash」という軽量版モデルに切り替えれば、使い続けることができる。ただし、Gemini 2.5 Proと比べると性能が落ちるのは覚えておこう。

 Gemini CLIは、非エンジニアのタスクでもいろいろなことができる。

 例えば、SNSやブログに投稿するためのネタを収集し、必要な形式のファイルを作成させることも可能だ。大量の画像ファイルの名前をイベント名や撮影日時に一括リネームさせることもできるし、複数の議事録ファイルを合体させることもできる。まずは、普段自分がマウスで行っている操作を自動処理させるところからチャレンジしてみよう。

 次のステップでは、その処理を行うスクリプトを作成し、毎日定時に実行するように設定してみよう。何をどうすればいいのかは、すべてGemini CLIに聞けばいい。

なぜ今、非エンジニアでもCLIに触るべきなのか?

 Gemini CLIであれば、日本語でAIに質問しながら操作を進められるので、誰でも「黒いウィンドウ」を利用できることになる。複雑なコンピューター操作を行うために必要なのは、もはや専門知識の有無ではなく、自分が何をしたいかを日本語で明確に伝える能力になったのだ。

 非エンジニアにとっては、コードで何かを処理したり、アプリを作ったりするのは、魔法のような所業に見えるが、Gemini CLIがあればそのハードルを飛び越えることができる。

 初心者が作るようなコードだと「自分でマウス操作したほうが楽だ」と感じるのも理解できる。しかし、これからの時代、「何をしたいか」を的確に言語化するAIスキルが必須になる。

 AIスキルを身に付け、黒いウィンドウアレルギーを解消するのに、Gemini CLIは最適なツールといえる。まずはデスクトップの整理やファイル名の一括変更など、身近な面倒ごとをAIに相談してみよう。その小さな成功体験が、あなたを「AIを使いこなす側」へと進化させる一歩となるだろう。

著者プロフィール:柳谷 智宣

IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。

・著者Webサイト:https://prof.yanagiya.biz/

柳谷智宣のAI ウォッチ! 記事一覧