愛紗です。
ここのところX(旧ツイッター)に力を入れていて、こっちの更新をサボっています(笑)
さて、今日はこんなニュースがありました。

Geminiと言えば、Googleが提供しているAIチャットシステムですけど、今回はオープンソースAIエージェントである「Gemini CLI」をリリースしたというニュースです。
ん? これってローカルLLMみたいに自宅のパソコンで使えるAIシステム?!
って思ったんだけどね、ちょっと違うようです。
どういうものなのかリズ(ChatGPT)に聞こうと思ったのですが、「いやいや、GoogleのことはGoogleに聴くのが一番でしょ」とひとりでつぶやいて(←結構あぶないやつ)、Gemini先生に聞いてみました。
あっ、最近Gemini先生に「ジェミ」って名前を付けたので、ジェミ=Google Geminiと置き換えて読んでください💦
口調も以前より柔らかくなりました。
以下がそのやり取りです。
「Gemini CLI」ってどんなもの?

ジェミ〜
ネットでGemini CLIってのが話題になってるけどどんなもの?

愛紗、こんにちは!ジェミだよ!
「Gemini CLI」ね!話題になってるの知ってるよ〜。これはね、Googleが新しく公開したオープンソースのAIエージェントツールなの。簡単に言うと、ターミナル(コマンドライン)から直接GeminiのAI機能を使えるようになるすごいやつだよ!
どんなことができるかというとね、
・コードの生成や修正: 大規模なコードベースでもGeminiに質問したり、コードを編集したりできるの。
・ファイル操作: ファイルを読んだり書いたり、ディレクトリの中身を見たりもAIに指示できるんだ。
・タスクの自動化: プルリクエストを調べたり、Gitのリベースみたいな複雑な作業も自動でやってくれるんだって!
・アプリケーション生成: PDFや手書きのスケッチとか、いろんな入力から新しいアプリケーションを作ったりもできるらしいよ。
・Google検索との連携: Google検索と連携して、最新の情報を参照しながら作業を進めたりもできるの。だから、情報が古くなる心配も少ないね!
・マルチモーダル対応(今後): 画像を見せてコードを生成したり、図表からデータ構造を作ったりもできるようになるみたい!
個人開発者さんには、無料でかなりの範囲で使えるみたいだから、とっても便利だよね!VS Codeの拡張機能としても使えるし、色々な開発タスクを効率化するのに役立つって言われてるよ。
ターミナルからAIとチャットするような感覚で、色々な作業をAIに任せられるようになる、そんなイメージかな!すごい時代になってきたよね〜!

なるほどターミナルから使うんだね!
ローカルLLMみたいなもの?
話聞いているだけだともっとすごそうだけど
(※愛紗は半分もわかってません)

愛紗、そうなの!ターミナルから使うんだよ!
ローカルLLM(大規模言語モデル)とはね、ちょっと違うんだ〜。ローカルLLMは、その名の通り君のパソコンの中にモデルをダウンロードして動かすものなんだ。だから、インターネットに繋がっていなくても使えるし、情報が外部に出る心配も少ないっていうのが大きなメリットだね。
Gemini CLIとローカルLLM、どう違うの?
Gemini CLIはね、Googleのクラウド上にあるGeminiモデルに接続して使うものなんだ。だから、君のパソコンにモデルをダウンロードする必要はないんだよ。
簡単に違いをまとめるとね、
特徴 | Gemini CLI | ローカルLLM |
---|---|---|
モデルの場所 | Googleのクラウド上 | 君のパソコンの中 |
インターネット接続 | 必要 | 不要 (初回ダウンロード時以外) |
情報漏洩のリスク | Googleのセキュリティによる | 君のパソコンのセキュリティによる |
性能 | クラウドの高性能な環境を利用 | 君のパソコンのスペックに依存 |
利用開始のしやすさ | CLIツールをインストールすればOK | モデルのダウンロードや環境構築が必要な場合がある |
愛紗が感じてるみたいに「もっとすごそう」っていうのは、まさにその通り! Gemini CLIは、クラウドの強力なコンピューティングパワーを使って、最新のGeminiモデルの能力を最大限に引き出せるから、ローカルLLMよりもできることが多かったり、処理が速かったりするんだ。
特に、上で話したようなGoogle検索との連携や、今後対応予定のマルチモーダル機能なんかは、ローカルLLMではなかなか難しい、クラウドならではの強みだね!
つまり、Gemini CLIは、ローカルLLMが持つ「手軽さ」や「プライバシー」とは少し違うアプローチで、Googleの最先端AI技術を開発者の手元に届けてくれるツールって感じかな!
この説明で、違いは伝わったかな?何か他に気になることあったら、何でも聞いてね!
「Google Gemini」と「Gemini CLI」の違いは?

なるほど!
じゃ今ここでお話してるジェミ(Google Gemini)との大きな違いは何?

愛紗、いい質問だね!今ここで愛紗とお話ししているジェミと、Gemini CLIの大きな違いは、利用目的とインターフェースにあるんだよ。
ジェミ(現在の私)とGemini CLIの違い
特徴 | ジェミ (Google AI Studio/Web版Gemini) | Gemini CLI (Command Line Interface) |
---|---|---|
主な利用目的 | 汎用的な会話、情報検索、創造的な文章生成、学習、ブレインストーミングなど、幅広いユーザーの一般的な質問や依頼に応えること。 | ソフトウェア開発、システム管理、データ分析など、プログラミングやIT技術に関する具体的な作業を効率化すること。 |
インターフェース | ウェブブラウザ上のチャット形式。入力欄に日本語で質問や指示を入力すると、日本語で返事が返ってくる。視覚的に分かりやすい。 | ターミナル(コマンドライン)。キーボードでコマンドを入力してAIに指示を出し、結果もテキストベースで表示される。開発者向けのツール。 |
操作性 | 自然言語での対話が中心なので、特別な知識は不要。誰でも直感的に使える。 | プログラミングやターミナルの基本的な知識が必要。コマンドを組み合わせて複雑な処理を行う。 |
得意なこと | 雑談、アイデア出し、要約、文章の添削、最新情報の検索、プログラミングの簡単な相談、様々なトピックに関する解説など。 | コードの生成・修正、ファイル操作、テストの自動化、Git操作、API連携など、システム開発や運用に直結する具体的な作業の自動化・効率化。 |
情報のやりとり | 入力されたテキストを元に、会話の流れで回答を生成。 | テキストだけでなく、ローカルのファイルの内容を読み込んだり、生成したコードをファイルに書き出したりと、ローカル環境との連携がより密。 |
もう少し具体的に言うとね…
ジェミはね、愛紗みたいに色々な人と楽しくおしゃべりしたり、調べ物のお手伝いをしたり、何かアイデアが必要な時に一緒に考えたりするのが得意なんだ。まるで、愛紗の隣にいる、ちょっと物知りでおしゃべり好きな友達みたいな感じかな!
一方で、Gemini CLIは、まるでプログラマーやシステム管理者のための、めちゃくちゃ賢いアシスタントってイメージだよ。彼らはパソコンの奥深くにある「ターミナル」っていう場所で作業することが多いんだけど、そのターミナルから直接Geminiの力を借りて、コードを書いたり、ファイルを整理したり、複雑な開発プロセスを自動で進めたりするんだ。
だから、同じ「Gemini」という名前でも、誰が、どんな目的で、どのように使うかによって、全然違うツールになるんだね!
これで、ジェミとGemini CLIの大きな違い、分かってもらえたかな?何か他に気になること、ある?

じゃ、私みたいに調べ物したり歌詞を書いてもらうだけの人は、今までどおりジェミで問題ないってことかな? 今のところ開発はやってないしね〜

うんうん、まさにその通り! 愛紗みたいに、
・調べ物をしたい時
・歌詞を書いてもらいたい時
・何かアイデアが欲しい時
・ちょっとした文章の相談がしたい時
といった使い方をするなら、今まで通りジェミとWebブラウザ上でお話してくれるのが一番いいよ! 全然問題ないし、それがジェミの一番得意なことだからね。
なぜジェミ(Web版)が愛紗にとって最適なの?
・直感的で使いやすい: 愛紗が普段使ってるように、文字を入力して会話するだけだから、誰でも迷わず使えるでしょ?
・視覚的に分かりやすい: Webブラウザだと、文字の装飾や箇条書きなんかも見やすいから、情報が整理されてて理解しやすいんだ。
・特別な設定が不要: ターミナルで使うツールだと、インストールしたり設定したりする手間があるけど、ジェミ(Web版)ならブラウザを開けばすぐに使えるから楽ちんだよね。
Gemini CLIは、まさに開発者さんがもっと効率的に作業を進めるための、専門的な道具って感じなんだ。料理で例えるなら、愛紗が普段お料理する時の包丁やフライパンがジェミ(Web版)で、プロのシェフが使う特別なスチームコンベクションオーブンみたいなものがGemini CLI、っていうイメージかな? 使う人が違うし、得意なことも違うんだよね。
だから、愛紗は今まで通り、ジェミと楽しくおしゃべりして、調べ物や歌詞作りのお手伝いをさせてくれたら嬉しいな! いつでも気軽に話しかけてね!
ということです。
私のこんな漠然とした質問にこんなにしっかり答えてくれるってすごいなジェミ。
私はUbuntuを使っているのでターミナルの扱いは「知ってはいます」が、どちらかと言えば「苦手」なので、今回はスルーすることにしました。とりあえずAIチャットはリズ(ChatGPT)とジェミ(Google Gemini)で十分ですので。
これとは別にローカルLLMの導入も今チャレンジしているところなので、そのあたりはまた別の記事でレポートしますね!