はじめに
株式会社ネクストスケープ Chief Technology Office所属の小野塚です
12月10日にリリースされたCursor2.2のDebugモードについて試してみました。
実は12月4日頃からEarlyAccessで触ることはできていて、この記事自体もリリース後に書いてはいたのですが、ちょっと色々忙しく2週間近く経っての公開となります。
では、いつものように以下のToDoリストを作成し、これで試してみたいと思います。また、これに対して幾つか不具合を仕込んでおきます。
「ToDoリスト機能の仕様を作成してください。タスクの追加、完了チェック、削除機能を含めて、基本的なToDoアプリとして動作するようにしたいです。要件から実装タスクまで段階的に作成してください。」
修正例1
仕込んだ不具合ではないのですが、まずはローカルでの起動時において以下のエラーが出たのでこれで試してみたいと思います。
Error Code: -102
URL: https://localhost:7164/

プロンプトの入力欄においてDebugモードが追加されているのでこれを選択します。

そして、エラーの内容を共有します。

そうすると(ちょっと見づらいですが)赤枠で以下のような提案といいますか、「不具合調査のためにこのような操作を行って欲しい」という指示が出ます。

指示に従って操作を行い、その旨を伝えると以下のような「仮説」が提示されます。この不具合調査のための指示と仮説、これが今回のDebugモードにおける他のモードとの違いではないかと思っています。

最終的に原因が明らかになり、

修正例その2
以下のようにToDoリストが起動されたのですが、今度は「英会話の勉強」というタスクを追加し、「削除」ボタンを押すと削除されません。
この不具合が今回仕込んだ不具合になりまして、

これも不具合内容を伝えると以下のようにまずは仮説を挙げてくれます。

そして、調査のための操作指示が出ます。これを必要に応じて繰り返し、最終的に修正してくれます。

修正例その3
もう1つ対応例をお見せしたいと思います。
以下のように複数タスクを登録し、一番上の「英会話の勉強」の削除をクリックすると何故かその下の「Task1」が削除されます(いきなり適当なタスク名になってしまってスミマセン。。)。

「タスクは削除されるのですが、削除ボタンを押したタスクと別のタスクが削除されます。下から順番に削除されているようです。」
と伝えると先ほどの仮説、調査のための操作が提示され、原因が判明すると以下のように原因と修正内容が表示されます。

そして、以下のように修正されているはずなのでこのように試してね、という形で指示が出ます。至れり尽くせりですね。。

終わりに
いかがでしょうか。今までのAgentですとAgent側で調査や修正を行ってしまい、あまりこちらに状況が共有されることはありませんでした(当然指示すれば修正前に原因は共有してくれますが)。
Debugモードではこのように仮説をきちんとユーザーに明示しー>その仮説を検証するためにどういった操作が必要かを示しー>原因がわかればそれとそれを修正する方法を説明しー>修正に至る
という形で丁寧に手順を踏んで、ユーザーと共に原因調査を行い、解決へと導いてくれます。
ちなみに、Cursorはこのような人間が介在するアプローチを「human-in-the-loop」と表現しています。
これにより、「いつの間にか直ってました。でも原因であったり、何故直ったかはAIが勝手にやっていたのでわかりません」といったことも無くなり、ユーザーの理解も深まります。
是非皆さん使ってみてください。
恐らく今年の記事登録は本記事で最後となる予定です。来年も皆様のお役に立つ情報をご紹介できればと思いますのでよろしくお願いいたします。
皆様良いお年を。
当社ネクストスケープはこのように生成AIを始めとした新しい技術・知識を日々取り入れており、Webサイト、スマホアプリ、Hololensアプリの開発をはじめ、CMSを利用したサイトの新規構築やリニューアルなど、お客様のニーズに幅広く対応いたします。お困りのことがございましたら、いつでもお気軽にお問い合わせください。
(以下当社お問合せフォーム)
当社では一緒に働いてくれる仲間を募集しています。是非以下のサイトよりお申込みください。