はじめに
株式会社ネクストスケープ Chief Technology Office所属の小野塚です。
Cursor2.0で発表された機能のうち、マルチエージェントとComposerモデルについて先日記事を書きました。
今回はCursor2.0でGAとなったAgent用ブラウザについて試した内容を書いてみたいと思います。
既に1.7でベータ版として公開されていますので今更感がある方もいらっしゃるかもですがご容赦を。
このAgent用ブラウザ、内蔵ブラウザ(Internal Browser)とも表現されていますが、Cursorの中にブラウザがあることで何がいいのか、何ができるのか、これから説明していきたいと思います。
自然言語によるブラウザ操作
まず、起動方法なのですが、以下のようにCursorの中央の画面において「Open Browser」という項目がありますのでこれをクリックするか、「Ctrl+Shift+B」を押してください。
すると以下のようにブラウザ用のウィンドウが開かれ、ウィンドウ上部にはChrome等の他のブラウザと同じように戻る、進む、リロード、そしてURLの入力欄があります。
プロンプトの入力欄に「yahoo.co.jpを開いて、「生成AI」で検索し、最初の検索結果をクリックしてください」と入力し、実行してみましょう。
そうするとブラウザ画面が指示した通りに動き、最初の検索結果が表示されたところで終了となります。

このようにブラウザを自然言語で操作することはPlaywrightのMCP等でも同様のことができるのですが、Playwright等と比べた場合にどうも反応の遅さが気になりました(以下はPlaywrightのMCPサーバーで同様のことを試した時の記事です)。
この内蔵ブラウザがベータ版として公開された時にも同様の感想を社内で聞いたことがあったのですが、その時はまだ私が触っていなかったため、そういうものなのだろうかと今一つピンと来なかったのですが、実際試してみると例えば「検索欄に入力して」という命令についても「まずは検索欄を探してみます」といったわざわざ報告不要なことをこちらに連絡し、検索したその結果を受け、検索欄が見つかったことをこちらに連絡し。。という感じで非常に時間がかかります。
Cursor2.0では前回の記事で紹介した爆速のComposerモデルが加わりましたのでこれを使えばもう少しマシに動作します。。が、やはり傍から見た時のやり取りの多さが気になるところです。
一旦そこは目をつぶり、もう少し試してみたいと思います。
自作のToDoアプリについても同様に操作が行えますのでlocalhostのアドレスを入力し、ToDoの追加のテストとして「今、intermalブラウザでこのアプリを立ち上げてますが、「Aさんにメールを送る」を追加して。」と指示すると、

以下のようにその通りに動作します。

ちなみにブラウザのメニューとしては以下のようなものがあります。

恐らく読んで字のごとしかと思いますので説明は省略しますが、以下の4つが存在します。
・Take Screenshot(表示範囲のスクリーンショットを取得))
・Take Full Page Screenshot(ページ全体のスクリーンショットを取得)
・Hard Reload(ハードリロード)
・Copy Current URL(現在のURLをコピー)
エレメント選択
あとは「エレメントの選択」機能(という名前で合っているのかわかりませんが。。)がちょっと他の同様のツールと一線を画すかと思いますのでこれを説明して終わります。
以下「Select element」をクリックします

すると以下のように要素ごとに選択が可能になりまして、タイトル部分の「H1」と表示された要素をクリックします。

するとプロンプトの入力欄にクリックした要素が表示され、これを対象にしたプロンプトが記述できます。

例えば「このエレメントの文言を「ToDoアプリケーション」に変更して」と指示すると以下のように。

あとはタイトルバー全体のDIVをクリックし、「選択したエレメントの色を明るい緑に変更して」と指示すると以下の通り。
「タイトルバー」と指示してしまうと選択結果が正しく反映されているかわからないので上のようなプロンプトで指示してみましたが、正しく動作しました。

終わりに
エレメントの選択は開発において非常に便利だなと思いました。あとはブラウザの操作時においてもっと反応が早くなってくれれば完全にCursorの中だけでデバッグ等が完結すると思いますのでCursorユーザーとして非常に期待しております。
プロンプトによるブラウザ操作については1つ1つ手順や状況を出力してくれるのもAIツールとしては有りだと思うのですが、例えばそういった情報を出力せずにどんどん操作してくれるようなモードがあったりすると嬉しいな。。と。
当社ネクストスケープはこのように生成AIを始めとした新しい技術・知識を日々取り入れており、Webサイト、スマホアプリ、Hololensアプリの開発をはじめ、CMSを利用したサイトの新規構築やリニューアルなど、お客様のニーズに幅広く対応いたします。お困りのことがございましたら、いつでもお気軽にお問い合わせください。
(以下当社お問合せフォーム)
当社では一緒に働いてくれる仲間を募集しています。是非以下のサイトよりお申込みください。