Google Gemini でトークンを実践検証してみた:PoCから得られた知見のご紹介

はじめに

NTTビジネスソリューションズの山本です。
本記事では、Google Gemini 2.5 ProやGoogle Gemini 2.5 Flash Image(別名Nano Banana)におけるトークンと課金の考え方について学んだ内容を紹介します。
本記事は2025年10月時点の情報に基づきます。

対象読者

本記事が想定する対象読者は以下の通りです。

  • 生成AIに興味を持っている人
  • 生成AIにおけるトークンについて知りたい人
  • Google Gemini CLIとNano Bananaを使っている人

背景・目的

  • Google for Developersのブログで「最先端の画像処理モデル Gemini 2.5 Flash Image のご紹介」の記事が公開されており、興味を持ちました。

最先端の画像処理モデル Gemini 2.5 Flash Image のご紹介 - Google Developers Blog

  • ちょうど、Google for Developersのコミュニティイベントが開催される直前で申し込みをし、PoC環境を構築しました。
  • その後無料試用期間が終了し、有料に替わるタイミングで、課金の概念(トークン)の理解を深めたいと考えました。

Google Gemini CLIの使用方法

前提条件・動作環境
  • Node.jsがインストールされていること。
  • 今回はWindows環境上でWSL+VS Codeを使用します。筆者の環境は次の通りです。
    ホストOS: Windows 11 Pro 25H2
    使用したディストリビューション: Ubuntu 24.04.3 LTS
    VS Codeのバージョン: 1.105.1
  • Googleアカウントは個人名義で問題ありません。ただし、今回の検証を実施すると料金が発生します。その点ご留意下さい。

Node.jsがインストールされたら以下のコマンドでGemini CLIをインストールします。

 # npm install -g @google/gemini-cli

以下のコマンドを利用し、Gemini CLIを起動します。

 # gemini
認証

認証方法は、下記の3パターンあります。

  1. Googleで認証
  2. Gemini API Keyで認証
  3. Vertex AIで認証

今回はGEMINI_API_KEYで認証しました。APIキーの取得方法は、

Gemini API キーを使用する  |  Google AI for Developers

を参照してください。

Gemini CLIの使用
  1. プロンプトを打ってみる:今日の大阪の天気は?->Google検索を利用します。
    図1:Gemini CLIにプロンプトを入力
  2. Geminiからの回答が表示される。
    図2:Geminiからの回答を表示
  3. 終了する際は、Ctrl+Cキーを2回押してください。

トークンの確認

ここからトークンについて学んでいきます。詳細はこちらをご確認ください。

トークンを理解してカウントする  |  Gemini API  |  Google AI for Developers

Gemini や他の生成 AI モデルは、トークンと呼ばれる粒度で入力と出力を処理します。 Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)に相当します。

トークンは、z などの単一の文字、cat などの単語全体にすることができます。長い単語は複数のトークンに分割されます。モデルで使用されるすべてのトークンのセットを語彙と呼び、テキストをトークンに分割するプロセスをトークン化と呼びます。 課金が有効になっている場合、Gemini API の呼び出し費用は、入力トークンと出力トークンの数によって決まります。そのため、トークンのカウント方法を知っておくと便利です。

トークンについては、Colabの環境で対話型で学習することができます。

Google Colab

図3:トークン数を確認

プロンプトのトークン数は、7つと確認することができました。あとは Gemini 側で処理をし、結果を出力するだけです。
ここまで来て気になることを思い出しました! Geminiは質問を受け取ったあと、Google検索を使用して内容を調査し、確認してから回答していました。
ひょっとすると、この思考の過程もトークンとしてカウントしているのでは?と考えました。

Gemini モデルのトークン数をカウントする  |  Firebase AI Logic

をもとに、Gemini モデルのトークン数をカウントする python スクリプトを作成します。

import google.generativeai as genai

# APIキーを設定
genai.configure(api_key="YOUR_API_KEY")

def count_tokens(prompt_text, model_name="gemini-2.5-pro"):
    """トークン数をカウントして詳細を出力"""
    model = genai.GenerativeModel(model_name)

    # トークン数をカウント
    token_count = model.count_tokens(prompt_text)

    # 結果を出力
    print(f"prompt_token_counts: {token_count.total_tokens}")

    # レスポンス生成してトークン数を取得
    response = model.generate_content(prompt_text)

    print(f"candidates_token_count: {response.usage_metadata.candidates_token_count}")
    print(f"prompt_token_count: {response.usage_metadata.prompt_token_count}")
    print(f"total_token_count: {response.usage_metadata.total_token_count}")

    return response

# 使用例
if __name__ == "__main__":
    prompt = "今日の大阪の天気を教えて?"
    count_tokens(prompt)

図4:実行結果

トークンをカウントするオプション

Gemini API の入力と出力はすべてトークン化されます。トークンのカウント方法には次のオプションがあります。

  • prompt_token_count: 入力のみのトークン数
  • candidates_token_count: 出力のトークン数(思考トークンは含まれません)
  • total_token_count: 入力と出力の両方のトークンの合計数(思考トークンを含む)

上記のオプションについては、次の点に注意してください。

  • 入力トークン数には、プロンプト(テキストと入力ファイル)だけでなく、システム指示とツールも含まれます。
  • 出力トークン数には思考トークンは含まれません。思考トークンは別のフィールドで提供されます。

トークンの考え方について詳細調査

Google AI Studio では確認できなかったのですが、Vertex AI Studio でトークンの考え方イメージを視覚的に確認することができました。
プロンプト入力時のトークン数、処理後のトークン数がわかります。

図5:Vertex AI Studio

返答完了後、381個のトークンと表示されています。Vertex AIも料金が発生します。検証される場合は、ご留意下さい。

まとめ

  • トークンの考え方やカウント方法について理解を深めることができました。トークンの扱いはモデルによって異なり、特に料金に直結する要素であるため、継続的に情報をアップデートしながら学習する必要があると感じています。
  • 今回のPoCでは従量課金でAPIを利用しましたが、実際のシステム導入時には、利用状況や予算に応じたコスト制御の仕組みを検討することが重要であると再認識しました。
  • 以下は、チャットでのPoC実施時の請求結果です。
SKU サービス 使用料 使用費用
Generate content output token count Gemini 2.5 Pro short output text Gemini API 7,398 count ¥11
Generate content input token count Gemini 2.5 Pro short input text Gemini API 18,943 count ¥4
Generate content cached input token count gemini 2.5 pro short input Gemini API 32,442 count ¥1

執筆者

山本 寛(NTTビジネスソリューションズ エンタープライズビジネス営業部所属)
現在はMicrosoft 365やGoogle Workspaceを活用した設計、構築案件に携わっています。
技術士(情報工学部門)、PMI認定PMPなど取得。

参考資料・出典

最先端の画像処理モデル Gemini 2.5 Flash Image のご紹介 - Google Developers Blog

Gemini API キーを使用する  |  Google AI for Developers

トークンを理解してカウントする  |  Gemini API  |  Google AI for Developers

Google Colab

Gemini モデルのトークン数をカウントする  |  Firebase AI Logic

商標 

  • 「Google」「Gemini」「Vertex AI」「Google Workspace」は、Google LLCまたはその関連会社の商標もしくは登録商標です。
  • 「Windows」「VS Code」「Microsoft 365」は、米国Microsoft Corporationの米国およびその他の国における商標もしくは登録商標です。
  • 「PMI」「PMP」は 、米国Project Management Instituteの商標もしくは登録商標です。
  • 「Node.js」は 、Joyent, Inc.の商標もしくは登録商標です。
  • 「Python」は、Python Software Foundationの商標もしくは登録商標です。

© NTT WEST, Inc.