NEXTSCAPE blog

株式会社ネクストスケープの社員による会社公式ブログです。ネスケラボでは、社員が日頃どのようなことに興味をもっているのか、仕事を通してどのような面白いことに取り組んでいるのかなど、会社や技術に関する情報をマイペースに紹介しています。

MENU

Gemini in BigQueryを触ってみた

はじめに

株式会社ネクストスケープ エンタープライズサービス部の小野塚です。

ここ最近の記事ではAIツールについて色々とご紹介してきました。

特に最近についてはNotebookLM、Firebase Studio、Julesと、Googleのサービスについてフォーカスを当ててきた形となります。
今回は同じくGoogleのGemini、正確にはGemini in BigQueryについてご紹介させていただきたいと思います。

サンプルデータ選択

ということで早速試してみましょう。
まずは以下がBigQueryのTOP画面になります。

画像
そもそもBigQueryはDWHですのでデータが無いと使えません。
BigQueryではサンプルデータが用意されているのでまずはそれで試してみたいと思います。
上記のTOP画面の赤枠部分、「Add data」をクリックすると右側から以下のような画面が表示されます(各スクリーンショットについては文字が小さく見えづらい部分もあると思いますのでブラウザの拡大機能等ご利用ください)。


そして赤枠の「Star a project by name」をクリックし、以下のダイアログが表示されるので「bigquery-public-data」と入力して「Star」をクリックします。


すると以下のように左側の「Explorer」のツリー部分に上記で追加したデータ(データセット)が追加されます。


このデータセットの中には以下のような名前のデータがありまして、Eコマース(ECサイト)におけるGoogleAnalyticsのGA4のデータ、ECサイトの各ページにおけるPV数等が入っています。

・bigquery-public-data.ga4_obfuscated_sample_ecommerce

これを元にBigQueryにおけるGemini絡みの機能を見てみたいと思います。

Cloud Assistの利用

まずは画面右側のCloud AssistでGeminiとのチャットを開始します。


すると以下のようにプロンプトの入力が可能になります。


このCloud Assistはエンジニア向けのSQLを書くための支援ツールとなりますので、以下のようなプロンプトを投げてみます。

「【要件】
・ページビュー数が多いページを上位10件表示したい
・ページのURLまたはタイトルでランキングを作りたい
・初心者にもわかるように、クエリの各部分を説明してください
GA4のデータ構造についても簡単に教えてもらえると助かります。」

すると、以下の画面右側にクエリが表示されます。
左側赤枠部分でクエリを実行できますのでそこで今回の出力されたクエリを試してみると、要望通りPV数をTOP10を抽出できました。

正しく出力されない場合もあるのですが、そこもこのCloud Assistに問い合わせることで修正してくれます。


Cloud Assistは基本的にSQLの記述支援になりますので基本的にはSQLの提示のみになるのですが、プロンプトの書き方を工夫することでクエリ自体の説明はもちろん、以下のように今回対象としているGA4のデータ構造についても教えてくれます。


ちなみに画面右側のスペースが狭くて見づらい場合は以下のように3点リーダーから「Full page」をクリックすると。。


以下のように別タブでチャット部分が広く表示されるようになります。


もう少しだけ横道にそれますと、クエリ結果のところの「Chart」。ここをクリックすると。。

以下のようにその結果のグラフ表示ができます。


BIツールであるLooker Studioでもいいのですが、簡易的でよければこのようにBigQueryだけで完結出来ます。

独自データ及びデータキャンバスの利用

さて、次は別のGeminiを使った機能を試してみたいと思います。
上記のECサイトのデータですと自分の作ったサイトではないこともあり、あまり馴染みのないデータであるため、もう少しわかりやすいデータにしてみたいと思います。
そこで、仮想の(カレーに特化した)食品メーカーとレトルトカレーの製品に関するアンケート結果のデータを作ってみます。辛さとレビュー、値段(今回は定価とします)も加えます。


このデータ(currysurverという名前にしています)をBigQueryに追加し、「データキャンバス」という機能で取り込みます。

では、「最も人気の商品を教えて」と聞いてみます。


すると自動的にその結果を求めるためのクエリを作成・実行し。。。


グラフも含め結果を出してくれます(人気=アンケートの結果が多いという判断です)。
ちなみに結果についての説明が英語で書かれてますが、「日本語で」とお願いすると日本語で出力してくれます。


では別の質問で日本語での回答を求めてみましょう。
「結果を日本語で説明してください。どの辛さレベルが最も人気ですか?」と聞いてみます。

画像
するとちゃんとアンケート結果を元に回答してくれます。
一番人気だけでなく、その辛さが何件あって。。ということもちゃんと教えてくれます。素晴らしい。


そもそも取り込んだデータについて実はよくわかってなくて。。という場合でも以下のように質問すると説明してくれました。カラム名や製品名からの推測だと思いますが、教えたことが無いにも関わらず適格に説明してくれます。


ちなみにデータキャンバスは最初は何もない状態ですが、Geminiとやり取りをしていくと、以下のように複数のパネルが紐づけられていきます。
これはデータや解析作業の関連状況を表していまして、従来のBIツールでは結果のみ出力されているため、どうやって作ったかは作った人間にしかわからないのですが、BigQueryではこのデータキャンバスによってどのようにデータが処理されているか、なぜこの結果になったのかを追跡することができます。

最後に

このようにデータキャンバスは簡単なプロンプトにもかかわらず、色々と配慮した形で情報を出力してくれます。

今回データについても急ぎ準備・出力したものなので、データ量はもちろんのこと製品に関する情報としては欠けている部分が多々ありました。
例えば購入日時等もデータの一項目として追加すれば(存在していれば)、月毎もしくは季節に応じた売り上げの違い、傾向等も出てくるはずなのでそういったものもGeminiが自動的に解析を行い、アドバイスをしてくれるのではと思います。

つまり実際のデータで、かつその量や質がしっかりしたものであればあるほど、それに応じた情報・解析結果を出力してくれます。

今までCursor等コーディング支援のツールを中心に触ってきまして、ある程度AIを使うことに対する「慣れ」も多少ながら出てきたのですが、今回DWHにおけるビッグデータを対象にしたAIツールということで、改めて「おっ」と思わされる内容でした。
今までのどれともまた違った魅力を持ったツールです。

是非使ってみてはいかがでしょうか。

当社ネクストスケープはこのように生成AIを始めとした新しい技術・知識を日々取り入れており、Webサイト、スマホアプリ、Hololensアプリの開発をはじめ、CMSを利用したサイトの新規構築やリニューアルなど、お客様のニーズに幅広く対応いたします。お困りのことがございましたら、いつでもお気軽にお問い合わせください。

nextscape.net

(以下当社お問合せフォーム)

Microsoft Forms