OpenAI出身の著名な研究者たちが共同創業し、潤沢な資金をもつスタートアップのThinking Machines Labが最初の製品を発表した。それは、フロンティアAIモデル(最先端の汎用的AIモデル)のカスタム版の作成を自動化するツール「Tinker」だ。
「Tinkerは研究者や開発者によるモデルの実験を支援し、最先端の能力をより多くの人々に開かれたものにすると信じています」と、Thinking Machines Labの共同創業者兼最高経営責任者(CEO)であるミラ・ムラティは発表前に『WIRED』に語った。
ファインチューニングの“民主化”
大企業や学術研究機関はすでに、オープンソースのAIモデルをファインチューニングし、数学の問題解決、法的文書のドラフト作成、医学的な質問への回答など、特定のタスクに最適化された新しいバリアントを生み出している。
通常、この作業を安定的かつ効率的に行なうには、GPUクラスタの確保と管理に加え、大規模なトレーニングを支える多様なソフトウェアツールが必要となる。Tinkerが目指すのは、こうした作業の大部分を自動化し、より多くの企業や研究者、さらには興味あって取り組む人々までが、独自のAIモデルをファインチューニングできるようになることだ。
Thinking Machines Labのチームは、フロンティアモデルのファインチューニングを人々が実施できるよう支援することが、AIの次の潮流になると考えている。そして、その考えは正しいかもしれないと信じる理由がある。Thinking Machines Labは、ChatGPTをつくりあげるのに中心的な役割を果たした研究者たちによって率いられている。わたしが話したベータテスターによると、市場にある類似ツールと比較した場合、Tinkerは強力でユーザーフレンドリーだという。
ムラティは、Thinking Machines LabがAIモデルのチューニング作業にまつわる神秘性を取り払い、より多くの人々がAIの限界を探求できるようにしたいと語る。「わたしたちは最先端の能力をすべての人に開放しようとしています。これは流れを大きく変えるはずです」と彼女は言う。「世の中には優秀な人が数多くいます。フロンティアAI研究には、できるだけ多くの優れた人たちに参加してもらう必要があるのです」
AI業界が注目する実力者チーム
Tinkerは現在、2種類のオープンソースモデルをファインチューニングできるようにしている。メタ・プラットフォームズのLlamaとアリババのQwenだ。ユーザーは数行のコードを書いてTinker APIを利用し、教師あり学習を通じてファインチューニングを開始できる。または、ラベル付けされたデータでモデルを調整する、強化学習を通じて行なうこともできる。強化学習は、出力に基づいて正または負のフィードバックを与えることでモデルをチューニングする、ますます人気が高まっている方法だ。ユーザーはその後、ファインチューニングされたモデルをダウンロードして、好きな場所で実行できる。
AI業界はこのローンチを注視している。その理由の一部は、背後にいるチームの実力にある。ムラティはかつてOpenAIの最高技術責任者(CTO)だった。彼女は2023年末に取締役会がサム・アルトマンを解任した後、OpenAIのCEOを短期間務めた。約10カ月後、彼女は会社を去ることを発表した。
ムラティはThinking Machines Labを、ほかのOpenAIの元幹部らと共同創業した。そのなかには、OpenAIの共同創業者であるジョン・シュルマン、元研究担当副社長のバレット・ゾフ、安全性とロボティクス研究に取り組んでいたリリアン・ウェン、事前学習と推論に取り組んでいたアンドリュー・タロック、事後学習スペシャリストのルーク・メッツが含まれる。このチームは、製品を発表する前から多くの注目を集めた。7月、Thinking Machines Labはシードラウンドとして驚異的な20億ドルを調達したことを明らかにし、120億ドルという高い評価額で注目された。
シュルマンは、強化学習を通じてChatGPTを動かす大規模言語モデル(LLM)のファインチューニング作業を主導した。人間のテスターからの入力はモデルに報酬信号を提供する。これにより、モデルは首尾一貫した会話を維持し、脱線せずに質問に答え、望ましくない行動を避けることにおいて、(完璧ではないが)はるかに優れるようになる。彼はTinkerが強化学習やほかのトレーニングトリックを活用することで、より多くの人々が大規模モデルから新しい能力を引き出しやすくすると主張している。
「秘密の魔法のような要素は多くありますが、トレーニングループについてはユーザーが完全に制御できます」とシュルマンは『WIRED』に語る。「わたしたちは分散トレーニングの詳細を抽象化していますが、データとアルゴリズムに関しては、使う人が完全に制御できるのです」
ベータユーザーには好評
Thinking Machines Labは、10月1日からユーザーがTinkerへのアクセスを申請できるようにした。同社は現在、APIを無料で提供しているが、最終的には課金を始める予定だ。
APIはこれまですでに、一部のベータユーザーに提供されていた。そのなかには、AIモデルがもたらすリスクに焦点を当てた企業であるRedwood Researchの研究者、エリック・ガンがいる。彼は、Tinkerの強化学習機能を使ってコードにバックドアを書くよう、モデルをチューニングしていると語る。
ガンはTinkerによって、APIを使うだけでは明らかにならないような能力をモデルから引き出すことが可能になったと話し、ファインチューニングの調整は比較的簡単だと続ける。「強化学習をゼロから行なうよりも、Tinkerを使う方がはるかに簡単です」とガンは述べ、さらに「非常に専門的なタスクがあって、既存のモデルでは対応できない場合には、強化学習が特に有効です」と付け加えた。
別のベータテスター、大規模AIプロジェクトの管理技術を提供する企業AnyscaleのCEOであるロバート・ニシハラは、VERLやSkyRLのようなほかのファインチューニングツールがすでに存在するものの、Tinkerは抽象化とチューニング可能性の素晴らしい組み合わせを提供していると述べている。「これは素晴らしいAPIだと思うし、多くの人が使いたがるでしょう」と彼は言う。
オープンソースモデルに関する根強い懸念は、それらがダウンロードされ、悪意のある方法で修正される可能性があることだ。Thinking Machines Labは現在、APIへのアクセスを得る人々を審査しているが、最終的には誤用を防ぐための自動システムを導入するとシュルマンは述べている。
“オープンであること”を重視
TinkerはThinking Machines Labの最初の製品かもしれないが、同社はすでにモデルトレーニングに関する基礎研究を発表している。このなかには、ニューラルネットワークのパフォーマンス維持に関する進歩や、LLMをより効率的にファインチューニングすることに関する研究が含まれており、Tinkerのようなツールを舞台裏で支えている。
現在、ほとんどの米国AI企業が最良のモデルを閉じた状態に保ち、APIを通じてのみアクセス可能にしている。このような時代において、LLMのチューニングプロセスをオープンにするというThinking Machines Labの計画はオープンさへのコミットメントを示している。中国は現在、米国よりも多くのオープンソースフロンティアAIモデルを持っており、これらのモデルは世界中の多くの企業や研究者によって使用されている。
ムラティは、Tinkerが商用AIモデルがますます閉鎖的になっている傾向を逆転させる助けになることを望んでいるという。「フロンティアラボで行なわれていることと、学術界の優秀な人々が実施していることは、ますます乖離してきていると思います」と彼女は語る。「これらの強力なシステムが世の中にどのように登場するかを考えたとき、それは望ましい状況ではないのです」
(Originally published on wired.com, translated and edited by Mamiko Nakano)
※『WIRED』による人工知能(AI)の関連記事はこちら。
- 元OpenAI研究者らの「Thinking Machines Lab」、史上最大20億ドル調達
- ミラ・ムラティ、新会社「Thinking Machines Lab」設立を発表
- ミラ・ムラティが見据える、人類とAGIの共存プロトコル|The Big Interview
雑誌『WIRED』日本版 VOL.57
「The Big Interview 未来を実装する者たち」発売中!
気鋭のAI研究者たちやユヴァル・ノア・ハラリが語る「人類とAGIの未来」。伝説のゲームクリエイター・小島秀夫や小説家・川上未映子の「創作にかける思い」。大阪・関西万博で壮大なビジョンを実現した建築家・藤本壮介やアーティストの落合陽一。ビル・ゲイツの回顧録。さらには不老不死を追い求める富豪のブライアン・ジョンソン、パリ五輪金メダリストのBガール・AMIまで──。未来をつくるヴォイスが、ここに。グローバルメディア『WIRED』が総力を結集し、世界を動かす“本音”を届ける人気シリーズ「The Big Interview」の決定版!!詳細はこちら。
