Journal

AIサブスクの値上げが止まらない。ローカル実行というもう一つの選択肢

最近、AIのサブスクリプション料金がものすごい勢いで上がっている。ChatGPTは月20ドルだったプランが、いつの間にか月200ドルの上位ティアを出し、AnthropicはMaxプランを月額100ドルから200ドルへ値上げした。GoogleもGemini Advancedの価格を釣り上げ、AppleはApple Intelligenceの一部の機能を有料化すると報じられている。

つまり、囲い込みの方向に進んでいるということだ。

正直なところ、ここまで一気に来るとは思わなかった。サブスクは大量生産で原価を下げて分配するモデルのはず。にもかかわらず各社が一斉に値上げに踏み切るのは、推論コストの単価がモデルの性能向上のペースに追いついていないからである。

ユーザー側から見える景色はかなり違う。「いいモデルが月20ドルで使える」という常識が、いつの間にか「まともなモデルを使うには月100ドル以上かかる」という常識にすり替わり、課金体系も複雑になり、Pro、Team、Enterprise、Max、Ultraと縦に細分化されていく。選ぶ側が混乱する構造になっているのは誰にとっても都合が悪いはずなのに、誰もやめない。

ここで、一つの問いが頭をよぎった。

自分のPCで、自分のモデルを、無料で動かすことは、いつまで選択肢であり続けるのだろうか。

はっきりさせておくと、2025年6月時点では、ローカルLLMはまともな対話相手になる。Llama 3.1 8BをRyzen 7 5700Uで回せば、英文の添削程度は遅滞なくこなす。日本語はまだ弱めで、長文生成は商用モデルに大きく劣るものの、コード補完や要約などタスクを絞れば実用に入る。量子化モデルの品質が急速に上がっているのと、ollamaのようなラッパーツールが揃ってきたおかげで、導入の敷居は去年とは比較にならない。

ローカルで動かす本当の価値は、プライバシーのためでも、検閲回避のためでもなく、サブスクの「値上げ」という政治的リスクから解放される点にある。ChatGPT Plusが値上がりしたところで、自分のPCで動くモデルには関係がない。OpenAIが利用規約を変えても、llama.cppのリポジトリが消えない限り、同じ重みを回すことができる。

これは所有の論理であり、サブスクは賃貸で、ローカル実行は購入である。賃貸には値上げリスクがつきまとう。購入には初期投資と維持コストがかかる。このどちらが得かは、利用頻度と機密性で決まる。仕事で毎日数千リクエストを投げるならサブスクの方がまだ安い可能性が高いし、月に数回しか使わないならローカル環境を一度立ち上げて放置するのが合理的だ。

自分自身、最近は簡単なコード生成や英文添削をOllama + Gemma 4 12Bの量子化モデルで済ませている。たまに間違いをし、生成速度はChatGPTより明確に遅い。それでも止まらず、ログが全部手元に残る。

サブスク一択の時代はそろそろ終わるだろう。性能と自由度と価格の三軸で言えば、ローカルは毎年じわじわと選択肢として重みを増している。AIの使用目的と財布の都合で賢く使い分ける。それが、これからの「AIと付き合う」標準になるだろう。

Previous