お久しぶりです、tomaです!
しばらく忙しくしていて、なかなか学習や情報収集に時間を割けずにいました…。
今回はリハビリも兼ねて、最近気になっていた「Gemini CLI」に少しだけ触れてみたので、その覚書を残しておこうと思います。
まだ調査中の段階で、試したことも少ないですが、「どこまで調べて何をしたのか」を記録することで、未来の自分や、これからGemini CLIを試す方の参考になれば幸いです。
Gemini CLIとは?ターミナルで使える万能AIアシスタント
まず、「Gemini CLIって何?」というところから始めましょう。
これは、Googleが開発したAIモデル「Gemini」の強力な機能を、ターミナル(コマンドラインインターフェース)から直接利用できるようにした、オープンソースのAIエージェントです。
これまでWebブラウザを開いて行っていた、
- AIへの質問
- コーディング
- 情報検索
- 文章の翻訳や要約
といった作業を、すべてキーボード中心のターミナル上で完結させることができます。特に開発者や、日常的にターミナルを操作するユーザーにとって、作業効率を飛躍的に向上させる可能性を秘めたツールです。
Gemini CLIでできること
Gemini CLIは、単にAIとチャットができるだけではなく、多彩な機能を備えています。
- 自然言語での対話: 「このコードのバグを修正して」「最新のAIニュースを要約して」といった自然な言葉で指示を出すだけで、的確な答えや処理を実行します。
- コーディング支援: コードの生成、デバッグ、テストの作成、さらには既存の膨大なコードベース(リポジトリ)全体を理解した上での質問にも対応します。
- ファイル操作: ローカルPC上のファイルの作成、編集、整理などを指示できます。「カレントディレクトリにある全てのテキストファイルを読み込んで、要約を作成して」といった操作も可能です。
- Web検索との連携: Google検索と統合されており、常に最新の情報を反映した回答を生成します。
- タスクの自動化: Gitの複雑な操作や、定型的な作業を自動化するスクリプトを生成・実行させることができます。
- マルチモーダル機能: テキストだけでなく、PDFや画像の内容を読み取らせて、それに基づいたタスクを実行することも可能です。
- 安全な実行環境: 「サンドボックス」と呼ばれる隔離された安全な環境でコマンドを実行するため、意図しないファイルの変更や危険なコマンドの実行を防ぐ仕組みが備わっています。
これらの機能から、開発者だけでなく、ライターやリサーチャー、さらには一般的なPCユーザーまで、幅広い層にとって便利なツールになりそうです。
MacBookにインストールしてみた!
能書きはこれくらいにして、早速インストールしてみましょう。
今回は、私のMacBook Air (M3) にインストールしてみました。
インストールには **Node.js** が必要なので、事前にインストールしておきましょう。
Node.jsがインストールされていれば、以下のコマンドをターミナルで実行するだけです。
npm install -g @google/gemini-cli
インストールが無事に完了したら、ターミナルで gemini
と入力すると、Gemini CLIが起動します。
初回起動時には、Googleアカウントでの認証や、見た目(テーマ)の設定などが対話形式で始まります。それが終われば、準備完了です!
簡単な対話と終了方法
起動したGeminiと少しだけ対話してみましたが、問題なく日本語で応答を得ることができました。
これで、いつでもターミナルからAIに質問できますね!
Gemini CLIを終了するには、/exit
と入力します。
すると、最後に以下のような統計情報が表示されました。
╭─────────────────────────────────╮
│ │
│ Agent powering down. Goodbye! │
│ │
│ │
│ Cumulative Stats (4 Turns) │
│ │
│ Input Tokens 26,244 │
│ Output Tokens 121 │
│ Thoughts Tokens 1,550 │
│ ───────────────────────────── │
│ Total Tokens 27,915 │
│ │
│ Total duration (API) 28.7s │
│ Total duration (wall) 8m 47s │
│ │
╰─────────────────────────────────╯
表示されているのは、トークンの使用量や処理にかかった時間ですね。
「このくらいのやり取りで、これくらいのトークンを消費するのか」というのが一目で分かるのは、とても良い機能だと思います。特にAPIを利用する場合、コスト管理の参考になりますね。
ちなみに、認証時にはGoogleアカウントだけでなく、Gemini APIのキーを選択したり、Vertex AIを選ぶこともできるようです。
Vertex AIについてはまだ詳しく調べていませんが、確かオリジナルのAIを作れるサービスだったはず…。
作り込めば、自分専用の超強力なCLIツールが作れるかもしれませんね!
まとめ:今後の可能性にワクワク!
今回は、まだ日本語の情報も少ない「Gemini CLI」を、インストールして少しだけ触ってみました。
ターミナルから離れずに、コーディングの相談から情報収集、ファイル操作まで完結できるというのは、想像以上に快適で、今後の開発効率が大きく向上しそうです。
まだまだ分からないことだらけですが、少しずつ使いながら、色々なことをさせてみようと思います。
それでは、また!