Tenstorrentの動向をウォッチしていて見つけた企業。未上場。
Cerebrasを初めて知った時くらいテンションが上がった。やってることが考え方の根本から狂ってる。
Taalas(タアラス / ターラス)
- 拠点: カナダ トロント
- 事業内容: 特定のAIモデルを『そのまま』シリコン(チップ)に焼き付ける
- 創業: 2023年
- 創業者: Ljubisa Bajic(リュビシャ・バイッチ)氏ら
- AIチップ企業Tenstorrent の初代CEO
- ジム・ケラー氏とCEOを交代後、独立してTaalasを立ち上げ
- 余談になるのだけど、リュビシャ氏にとって、ジム・ケラー氏は元AMD時代の上司で敬愛する人物らしい。ジムケラー氏を招聘して、TenstorrentのCEOの席を譲ったという噂。仲は良好とか(相当仲良くないと元上司にCEOの座譲らない気がする、さすがに)
- 資金調達: 会社を公開した2024年3月時点で、約5000万ドル(約75億円以上)を調達
ポイント
- 「Direct-to-Silicon」という独自技術(ある意味、力技)
- 「AIモデルそのもの」を回路としてチップに固定(ハードワイヤード)
- 例えば「Llama 3専用チップ」のように、特定のモデル専用のチップを自動生成
- プログラムを読み込むのではなく、チップに電気が流れるだけで計算が終わるため、圧倒的に速く、省電力。
いわゆるASIC化、が近い技術だと思う。このアプローチは「1つのモデルにしか使えない」という柔軟性の欠如が弱点。
この課題に対して、Taalasは「チップ設計を全自動化」することで、モデルが変わればすぐに新しいチップを作れるようにし、この弱点を克服しようとしている。製造工程を自動化とかではなく、チップの設計自体を自動化(このアプローチが常識外れ)
なんか狂ってる方針に見えて、「設計には時間がかかる」という従来の製造工程の常識を覆そうとしている(設計~製造までのリードタイムを0にしようとしている)点で、めちゃくちゃ革新的。これができたら、「めっちゃ使える新しいモデルがでました」のニュースが出た翌日には、「新しいモデルを載せたチップ生産できます」になるってこと。
メリット
- 効率◎: 従来のGPUに比べて電力効率やコスト効率が1000倍になると主張
- 速度◎: 外部メモリを使わず、チップ内に全てを収めるため超高速。メモリが高騰している現状でアドバンテージあり
ここまで、省電力化・高速化できると、エッジデバイス(小型機器)への搭載が視野に入る。
デメリット
反面、
- 柔軟性に難あり: 原則として、チップ製造後に中身のモデル(アーキテクチャ)を大きく変えることはできない(多少の重み調整は可能らしい)
モデルのチャンピオンレコードが数か月で更新されている現状において、古いモデルをハードワイヤードするメリットがデメリットを上回れるのか、素人考えでは疑問符が残る。たとえば、Groq、TPUに対して優位性がどこまであるのか…
と思ったけれど、エッジデバイス+大規模LLMの組み合わせなら、現状ライバルがいない(一番近いArmでも消費電力大きすぎ&動かせるモデルは小規模限定) から勝算ありなのかなぁ?
たとえば、WhisperとかStableDiffusionとか、エッジデバイスで使うモデルがある程度決まっている(枯れている)分野をターゲットにすればワンチャンありとみるか。
歴戦の猛者が考えた方針なので、この絶妙すぎる隙間を狙いに行った可能性が高いとみるのが妥当?今後の発展が楽しみな企業。
