DGX SparkでNVIDIAのNemoClawをLM Studioの「nvidia-nemotron-3-super-120b-a12b」につないでみた

NVIDIAのローカルLLM環境を活用して、エージェントフレームワーク「NemoClaw」を接続してみたので、その手順をまとめます。

今回は DGX Spark上でLM Studioを使い、nvidia-nemotron-3-super-120b-a12b をバックエンドとしてNemoClawを動かす構成です。

前提環境

以下の状態が整っていることを前提とします。

今回の構成は以下のようになります：

NemoClaw
   ↓
OpenShell (vLLM local provider)
   ↓
LM Studio (OpenAI互換API)
   ↓
nvidia-nemotron-3-super-120b-a12b

それでは実際に接続していきます。

まず、既存設定をクリアします。

nemoclaw my-assistant destroy

次に、オンボーディングを実行します。

NEMOCLAW_EXPERIMENTAL=1 nemoclaw onboard

ここで以下を選択：

LM StudioがOpenAI互換APIとして動いているため、この設定で接続可能になります。

次に、OpenShell側のモデル設定を行います。

openshell inference set \
  --provider vllm-local \
  --model "nvidia-nemotron-3-super-120b-a12b"

設定が正しく反映されているか確認します。

openshell inference get

続いてNemoClawの状態確認：

nemoclaw my-assistant status

問題なければ接続します。

nemoclaw my-assistant connect

openclaw agent --agent main --local -m "日本語で1文だけ返してください" --session-id test

正常に動作していれば、日本語で1文のレスポンスが返ってきます。

openclaw tui

対話UIでエージェントの挙動を確認できます。

今回試していて気づいたポイントをいくつか共有します。

http://host.openshell.internal:8000/v1 はOpenShell経由の内部解決用です。 LM Studio側でAPIサーバーが起動している必要があります。

nvidia-nemotron-3-super-120b-a12b

この文字列が LM Studio側と完全一致している必要があります。

オンボーディング時にこれを付けないと、local vLLMが選べない場合があります。

NEMOCLAW_EXPERIMENTAL=1

DGX Spark + LM Studio + NemoClawの組み合わせにより、クラウドに依存せず、オンプレでエージェント開発ができる構成としてかなり強力です。