2024年1月2日 01:03更新：2025年5月30日 23:08

GoogleのGemini APIの使い方

Google製の大規模言語モデル（LLM）のGeminiのAPIを使ってみたので、その使い方を紹介します。

Geminiとは

Gemini は、Googleが開発した大規模言語モデル（LLM）です。ChatGPTのように、テキストで対話できるAIです。Google I/O 2023で発表され、12月7日に公開されました。

GeminiにはUltra、Pro、Nanoの3つのサイズがあり、もっとも小さいNanoではGoogle Pixel 8 Proで動作します。また、ProはGoogle Bardの英語版のモデルとして採用されており、APIとしても利用できます。

Ultraはデモ動画が公開されており、YouTubeで閲覧できます。ただし、このデモはねつ造だったと報道されています。

Gemini APIの価格

Geminiの公式サイトの価格ページのスクリーンショット — Geminiの公式サイトの価格ページスクリーンショット

Gemini APIは記事執筆時点では1分あたり60クエリーまで、入力・出力ともに無料です。

これを超えると、入力は1,000文字あたり$0.00025、出力は1,000文字あたり$0.0005です。また、画像も入力でき、1枚あたり$0.0025です。

ChatGPTやGPT-3.5、GPT-4などのOpenAIのAPIではトークン数に応じて課金されるのに対し、Gemini APIでは文字数に応じて課金されるのが特徴です。

英語では1トークン≒1単語ですが、日本語では1トークン≒1文字です。そのため、OpenAIのAPIでは英語の方が安くなる傾向がありますが、Gemini APIでは日本語の方が安くなると思われます。

また、無料版では入力したテキストがAIの学習に利用されますが、有料版では利用されません。

Geminiの使い方

APIキーの取得

まずは、 Geminiの公式サイトにアクセスし、［Get API key in Google AI Studio］をクリックします。

Geminiの公式サイトのスクリーンショット。中央に大きく「Build with Gemini」と書かれている

注意書きが表示されるので、よく読んで理解したらチェックボックスにチェックを入れて［Continue］をクリックします。3つのチェックボックスのうち、下の2つは必須ではありません。

もし、APIを使うことが目的ではなく単にGeminiを試してみたいだけなら、中央の大きなテキストボックスにテキストを入力して［Run］をクリックすれば使えます。

APIとして使いたい場合は、左上から［Get API key］をクリックします。

新しくプロジェクトを作成してAPIキーを追加するか、既存のプロジェクトにAPIキーを追加するか尋ねられるので、どちらかを選択します。

APIキーが生成されるので、コピーしておきます。APIキーは他人に知られないように注意してください。

APIを使う

ここからは、取得したAPIキーで実際にAPIを使ってみます。

ここではJavaScript（Node.js）を使います。Pythonの場合は、公式のノートブックが分かりやすいです。他のプログラミング言語を使う場合は、公式チュートリアルを参考にしてみてください。

Node.jsでGemini APIを使うには、 Google AI JavaScript SDK をインストールします。

try{(()=>{function a(e){if(!e)return;let t=e.getAttribute("tabindex")!==null,n=e.scrollWidth>e.clientWidth;n&&!t?e.setAttribute("tabindex","0"):!n&&t&&e.removeAttribute("tabindex")}var u=window.requestIdleCallback||(e=>setTimeout(e,1)),i=window.cancelIdleCallback||clearTimeout;function l(e){let t=new Set,n,r;return new ResizeObserver(c=>{c.forEach(o=>t.add(o.target)),n&&clearTimeout(n),r&&i(r),n=setTimeout(()=>{r&&i(r),r=u(()=>{t.forEach(o=>e(o)),t.clear()})},250)})}function d(e,t){e.querySelectorAll?.(".expressive-code pre > code").forEach(n=>{let r=n.parentElement;r&&t.observe(r)})}var s=l(a);d(document,s);var b=new MutationObserver(e=>e.forEach(t=>t.addedNodes.forEach(n=>{d(n,s)})));b.observe(document.body,{childList:!0,subtree:!0});document.addEventListener("astro:page-load",()=>{d(document,s)});})();}catch(e){console.error("[EC] tabindex-js-module failed:",e)}

try{(()=>{function i(o){let e=document.createElement("pre");Object.assign(e.style,{opacity:"0",pointerEvents:"none",position:"absolute",overflow:"hidden",left:"0",top:"0",width:"20px",height:"20px",webkitUserSelect:"auto",userSelect:"all"}),e.ariaHidden="true",e.textContent=o,document.body.appendChild(e);let a=document.createRange();a.selectNode(e);let n=getSelection();if(!n)return!1;n.removeAllRanges(),n.addRange(a);let r=!1;try{r=document.execCommand("copy")}finally{n.removeAllRanges(),document.body.removeChild(e)}return r}async function l(o){let e=o.currentTarget,a=e.dataset,n=!1,r=a.code.replace(/\u007f/g,` `);try{await navigator.clipboard.writeText(r),n=!0}catch{n=i(r)}if(!n||e.parentNode?.querySelector(".feedback"))return;let t=document.createElement("div");t.classList.add("feedback"),t.append(a.copied),e.before(t),t.offsetWidth,requestAnimationFrame(()=>t?.classList.add("show"));let c=()=>!t||t.classList.remove("show"),d=()=>{!t||parseFloat(getComputedStyle(t).opacity)>0||(t.remove(),t=void 0)};setTimeout(c,1500),setTimeout(d,2500),e.addEventListener("blur",c),t.addEventListener("transitioncancel",d),t.addEventListener("transitionend",d)}function s(o){o.querySelectorAll?.(".expressive-code .copy button").forEach(e=>e.addEventListener("click",l))}s(document);var u=new MutationObserver(o=>o.forEach(e=>e.addedNodes.forEach(a=>{s(a)})));u.observe(document.body,{childList:!0,subtree:!0});document.addEventListener("astro:page-load",()=>{s(document)});})();}catch(e){console.error("[EC] copy-js-module failed:",e)}

npm install @google/generative-ai

Gemini APIでは、テキストからテキストの生成と、マルチターンのチャットが用意されています。また、ここでは説明しませんが、テキストと画像からテキストの生成もできます。

テキストからテキストを生成するには、次のようにします。

1
const { GoogleGenerativeAI } = require("@google/generative-ai");
2

3
const API_KEY = "ここにAPIキーを入力";
4

5
const genAI = new GoogleGenerativeAI(API_KEY);
6

7
const run = async(prompt) => {
8
  const model = genAI.getGenerativeModel({ model: "gemini-pro"});
9

10
  const result = await model.generateContent(prompt);
11
  const response = await result.response;
12
  const text = response.text();
13
  console.log(text);
14
}
15

16
run("魔法のリュックサックについての物語を書いてください。");

スクリプトを実行します。

node index.js

すると、次のようなテキストが出力されます。出力結果は実行するたびに変わります。

1
むかしむかし、あるところに魔法のリュックサックを持つ男の子がいました。リュックサックはどんなものでも詰め込むことができ、決して重くなりませんでした。男の子はリュックサックを学校に持っていき、本や文房具を詰めました。リュックサックは重くならず、男の子は一日中楽に持ち歩くことができました。
2

3
ある日、男の子は森を散歩していると、一匹の迷子の猫を見つけました。猫は寒そうで、お腹が空いているようでした。男の子は猫をリュックサックに入れ、家に連れて帰りました。リュックサックは重くならなかったので、男の子は猫を楽に持ち帰ることができました。
4

5
家に帰ると、男の子は猫にエサと水をあげました。猫は喜んで食べました。男の子は猫を毛布にくるみ、暖かくしてあげました。猫は毛布の中にもぐりこんで、すぐに寝入ってしまいました。
6

7
次の日、男の子は猫を森に連れて帰りました。猫は男の子に甘えて、なかなか離れませんでした。男の子は猫をなでて、「また会おうね」と声をかけました。そして、リュックサックに猫を入れて、家へと帰りました。
8

9
男の子は魔法のリュックサックのおかげで、猫を助けることができました。そして、猫は男の子の親友になりました。二人は毎日一緒に遊び、とても幸せに暮らしました。

次に、マルチターンのチャットを試してみます。

1
const { GoogleGenerativeAI } = require("@google/generative-ai");
2
const readline = require("readline");
3

4
const API_KEY = "ここにAPIキーを入力";
5

6
const genAI = new GoogleGenerativeAI(API_KEY);
7

8
const run = async (history, message) => {
9
    const model = genAI.getGenerativeModel({ model: "gemini-pro" });
10

11
    const chat = model.startChat({
12
        history,
13
        generationConfig: {
14
            maxOutputTokens: 500,
15
        },
16
    });
17

18
    const result = await chat.sendMessage(message);
19
    const response = await result.response;
20
    const text = response.text();
21
    return text;
22
}
23

24
const rl = readline.createInterface({
25
    input: process.stdin,
26
    output: process.stdout,
27
});
28

29
const ask = async (question) => {
30
    return new Promise((resolve) => {
31
        rl.question(question, (answer) => {
32
            resolve(answer);
33
        });
34
    });
35
};
36

37
const main = async () => {
38
    const history = [];
39

40
    while (true) {
41
        const message = await ask("ユーザー：");
42
        const response = await run(history, message);
43
        console.log("モデル：" + response);
44
        history.push(...[
45
            {
46
                role: "user",
47
                parts: message,
48
            },
49
            {
50
                role: "model",
51
                parts: response,
52
            },
53
        ])
54
    }
55
};
56

57

58
main();

スクリプトを実行すると、コマンドラインに［ユーザー：］と表示されるので、そこにテキストを入力してEnterキーを押します。すると、［モデル：］と表示され、AIの返答が表示されます。

実際に試したところ、次のようになりました。

1
ユーザー：あなたは優秀なアシスタントです。簡潔で適切な応答を返してください。では、自己紹介してください。
2
モデル：私は、あなたのリクエストやタスクに対して、正確で有益な応答を生成できるよう設計された、高度な言語モデルです。
3
ユーザー：Node.jsを使って天気を取得する簡単なコードを書いてください。
4
モデル：
5
```javascript
6
const request = require('request');
7

8
// OpenWeatherMap API キーを取得する
9
const apiKey = process.env.OPENWEATHERMAP_API_KEY;
10

11
// 都市名を取得する
12
const city = process.argv[2];
13

14
// 天気を取得するためのリクエスト URL を構築する
15
const url = `http://api.openweathermap.org/data/2.5/weather?q=${city}&appid=${apiKey}&units=metric`;
16

17
// リクエストを送信する
18
request(url, (error, response, body) => {
19
  // エラーが発生した場合はエラーメッセージを表示する
20
  if (error) {
21
    console.error(error);
22
    return;
23
  }
24

25
  // ステータスコードが 200 以外の場合もエラーメッセージを表示する
26
  if (response.statusCode !== 200) {
27
    console.error(`Error: ${response.statusCode}`);
28
    return;
29
  }
30

31
  // 天気情報を JSON としてパースする
32
  const data = JSON.parse(body);
33

34
  // 天気情報を出力する
35
  console.log(`都市: ${data.name}`);
36
  console.log(`天気: ${data.weather[0].description}`);
37
  console.log(`気温: ${data.main.temp}℃`);
38
});
39
```

また、先ほどのコードは完全に応答が返ってくるまでテキストが表示されませんが、次のようにすると応答の途中経過が表示されます。

1
const { GoogleGenerativeAI } = require("@google/generative-ai");
2
const readline = require("readline");
3

4
const API_KEY = "ここにAPIキーを入力";
5

6
const genAI = new GoogleGenerativeAI(API_KEY);
7

8
const run = async (history, message) => {
9
    const model = genAI.getGenerativeModel({ model: "gemini-pro" });
10

11
    const chat = model.startChat({
12
        history,
13
        generationConfig: {
14
            maxOutputTokens: 500,
15
        },
16
    });
17

18
    const result = await chat.sendMessageStream(message);
19
    return result;
20
}
21

22
const rl = readline.createInterface({
23
    input: process.stdin,
24
    output: process.stdout,
25
});
26

27
const ask = async (question) => {
28
    return new Promise((resolve) => {
29
        rl.question(question, (answer) => {
30
            resolve(answer);
31
        });
32
    });
33
};
34

35
const main = async () => {
36
    const history = [];
37

38
    while (true) {
39
        const message = await ask("ユーザー：");
40
        const response = await run(history, message);
41

42
        process.stdout.write("モデル：");
43
        let responseText = '';
44
        for await (const chunk of response.stream) {
45
            const chunkText = chunk.text();
46
            process.stdout.write(chunkText);
47
            responseText += chunkText;
48
        }
49
        process.stdout.write("\n");
50

51
        history.push(...[
52
            {
53
                role: "user",
54
                parts: message,
55
            },
56
            {
57
                role: "model",
58
                parts: responseText,
59
            },
60
        ])
61
    }
62
};
63

64

65
main();

ノート

Googleの公式ドキュメントでは、次のようなコードが書かれています。

1
// Use streaming with multi-turn conversations (like chat)
2
const result = await model.sendMessageStream(msg);

しかし、model.sendMessageStream()は存在しないため、chat.sendMessageStream()を使う必要があります。

まとめ

GoogleのGemini APIの使い方を紹介しました。Gemini APIは無料でもかなり使えるので、ぜひ試してみてください。

#Google #AI #HowTo #Gemini #プログラミング

このサイトを支援する

Buy Me a CoffeeまたはGitHub Sponsorsで支援していただけると、サイトの運営やコンテンツ制作の励みになります。定期的な支援と一度限りの支援がありますので、お間違いのないようにお願いします。

ろぼいん

X Misskey GitHub Qiita

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。

GoogleのGemini APIの使い方

Geminiとは

Gemini APIの価格

Geminiの使い方

APIキーの取得

APIを使う

まとめ

おすすめアイテム

このサイトを支援する

関連記事

Geminiをロック画面で使えるようにする方法

Google検索に表示されるAIをオフにする方法

「Gemini in Google Messages」発表！メッセージアプリでGeminiと会話できる新機能

GeminiからGoogleアシスタントに戻す方法

GeminiアプリとGoogleアシスタントが統合！使い方と注意点を解説

注目記事

【PC・スマホ】Discordでメッセージの文字を大きくする方法

Google ChromeやEdgeのフォントが変わったので元に戻す方法

X（Twitter）のいいねが見れない？いいねした人を確認する方法

「私のTwitter家族」「私のTwitterやりとりークル」は危険なスパム　犯罪組織が関わっている可能性も

X（Twitter）で引用リツイートが見れなくなった？新しい確認方法を解説

最新記事

Figmaが公式にMCPに対応　外部AIツールとの連携が可能に

YouTubeアプリが初代iPhone SEなどで利用不可に

Next.jsで最適化した画像をCloudflareでキャッシュできるようにする方法

Slackが一部APIに1分1回までの制限を追加　非マーケットプレイスアプリが対象

Amazon Musicでウィンドウを閉じるとバックグラウンド再生が止まる問題の対処法

GoogleのGemini APIの使い方

Geminiとは

Gemini APIの価格

Geminiの使い方

APIキーの取得

APIを使う

まとめ

おすすめアイテム

このサイトを支援する

関連記事

Geminiをロック画面で使えるようにする方法

Google検索に表示されるAIをオフにする方法

「Gemini in Google Messages」発表！メッセージアプリでGeminiと会話できる新機能

GeminiからGoogleアシスタントに戻す方法

GeminiアプリとGoogleアシスタントが統合！使い方と注意点を解説

注目記事

【PC・スマホ】Discordでメッセージの文字を大きくする方法

Google ChromeやEdgeのフォントが変わったので元に戻す方法

X（Twitter）のいいねが見れない？いいねした人を確認する方法

「私のTwitter家族」「私のTwitterやりとりークル」は危険なスパム 犯罪組織が関わっている可能性も

X（Twitter）で引用リツイートが見れなくなった？新しい確認方法を解説

最新記事

Figmaが公式にMCPに対応 外部AIツールとの連携が可能に

YouTubeアプリが初代iPhone SEなどで利用不可に

Next.jsで最適化した画像をCloudflareでキャッシュできるようにする方法

Slackが一部APIに1分1回までの制限を追加 非マーケットプレイスアプリが対象

Amazon Musicでウィンドウを閉じるとバックグラウンド再生が止まる問題の対処法

「私のTwitter家族」「私のTwitterやりとりークル」は危険なスパム　犯罪組織が関わっている可能性も

Figmaが公式にMCPに対応　外部AIツールとの連携が可能に

Slackが一部APIに1分1回までの制限を追加　非マーケットプレイスアプリが対象