ツヨツヨのローカルLLMをつくる -3- ソフトウェア関連

これでハードウェアは出来上がった。

次が「リクラスAI」として使えるようにするためのソフトウェア設定。
基本的な条件としては

いろいろと試行錯誤しながらインストールをしていった構成がこんなかんじ。

ハードウェア

いろいろ実験を繰り返している段階なので、ツッコミどころは色々ある(^_^;)

現在メインの推論モデル「qwen3.6:35b-a3b-q4_K_M」は商用サービスには届かないけどまずまずのレスポンス。でもハルシネーションが多いかな。

コーディング用の「qwen3-coder:30b」はレスポンスがいいので結構使えそう。

高性能なマシンだけあって、僕のような「逸般の誤家庭」では太刀打ちできないような環境ができた。

とはいえ、ClaudeやChatGPTのような商用サービスが日々磨いている機能性や使い勝手などにはまだまだ届かないという点が多いと思った。

そのへんは別記しよう。

画像生成についてはかなりすごい性能を感じているけれど、テキスト系の生成AIと共存するほどのVRAMに余裕がないのでBackend Switcherという仕組みを作って切り替えられるようにした。

だから通常は使えないようにしている。

試行錯誤した限りでは画像生成はきれいなものが出力できるけれど、設定やら導入するモデルやLoraモデルなどの選定、そのほかパラメーターが多すぎて難しい。

まぁ、できるという程度にしておこう。

まだ続く