Claude Fable 5が出て数日、早期に使った人たちの声が出そろってきました。性能の数字とは別に、「使ってみてどうだったか」の評判から見えるものを拾います。

モデルの基本は別記事に。

「指示する道具」から「一緒に働く相棒」へ

早期の反応で目立つのが、「これまでのAIと感触が違う」という声です。

複数の開発者が、Fable 5を「指示を出して使う道具」というより「隣で一緒に働く相棒」に近い、と表現しています。自分で計画を立て、自分が書いたコードをテストして、目で見て確認し、こちらが細かく舵を切らなくても進んでいく。その自律性が、これまでとの違いとして語られています。

私自身もそうですが、AIに何度も指示を出し直す手間に慣れていた人ほど、この「任せても勝手に進む」感覚は新鮮に映るようです。

12時間動き続けたという報告

具体的な驚きとして紹介されているのが、長時間の自律実行です。

ウォートン校のイーサン・モリック教授は、Fable 5がこれまで試したどの公開モデルもかなり上回り、複数ページにわたる仕様書をもとに最大12時間にわたって作業を実行した、と報告しています。

人が指示を出してから12時間、ひとりで動き続ける。これは「ちょっと賢くなった」とは次元の違う話です。大きな仕事を任せて、こちらは別のことをしている、という働き方が現実味を帯びてきました。

任せきりにしないための区切り方は、別記事に書いています。

テストを書きたがるクセ

評判の中で、おもしろいクセとして指摘されているのが「テストをよく書く」傾向です。

Fable 5は、自分が書いたコードが正しく動くかを確かめるテストを、積極的に書く傾向があるとされています。これは品質の面ではプラスで、自分の仕事を自分で検証しながら進めるからこそ、長時間でも崩れにくい。

一方で、人によっては「そこまでテストは要らない」という場面もあるでしょう。そういうときは、最初に「テストは最小限で」と伝えておけば調整できます。クセを知っておけば、指示で手なづけられます。

向いている人、急がなくていい人

評判を見ていると、向き不向きもうっすら見えてきます。

向いているのは、大きくて時間のかかる作業を抱えている人です。長い移行、複雑な実装、何日もかかる開発。こういう重い仕事を持っている人ほど、Fable 5の自律性と長時間の粘りが効きます。

逆に、ふだんが短い作業中心の人は、急いで飛びつかなくて大丈夫です。Opus 4.8やSonnetで足りているなら、無理にFable 5に乗り換える理由はない。重い仕事が来たときに思い出せばいい、くらいの距離感で十分です。

評判は「自分の作業」に引きつけて読む

ここで冷静になります。早期の評判は、熱量が高い人の声が目立ちやすい。すごい事例が拡散されるのは当然で、自分の作業でも同じ結果が出るとは限りません。

大事なのは、評判を自分の作業に引きつけて読むことです。「12時間の自律実行」がすごくても、自分が頼みたいのが30分の作業なら、その規模での使い勝手を自分で確かめるのが先。評判は入口の参考にして、判断は自分の手で、が基本です。

まず自分で小さく試す

結局のところ、いちばん確かな評判は自分の手元で作ったものです。

無料で試せる期間のうちに、自分のいつもの作業を1つ任せてみる。評判どおり「相棒」に感じるか、クセは気になるか。他人の感想を10件読むより、自分で1回試すほうが、ずっと早く腹落ちします。

まとめ

  • 早期の評判では「指示する道具より一緒に働く相棒に近い」という声が目立つ
  • 自分で計画・テスト・確認をして、細かく舵を切らなくても進む自律性が評価されている
  • モリック教授は複数ページの仕様書で最大12時間の自律実行を報告
  • 「テストを書きたがる」クセがあり、品質に効く一方で指示で調整もできる
  • 早期の評判は熱量が高い声が目立つので、自分の作業に引きつけて読む
  • いちばん確かなのは、無料期間に自分でひとつ試してみること