GPU CLOUD  //  JAPAN REGION

GPUを、欲しいだけ
NVIDIA H100 を
¥350/時から。

ComfyUI・LoRA学習・LLM推論・動画生成 — 思いついたら即起動。 秒課金、API完備、日本リージョン低遅延。
GPUを「借りる」ではなく、叩き込む

秒課金 起動 < 30s 東京/大阪リージョン 100GbE
heatgpu — bash — 80×24
$ heat gpu launch --type h100 --image comfyui
▸ provisioning H100 80GB ...
✓ ready in 23s — gpu-9k4n2x.heatgpu.com
 
$ heat gpu ssh gpu-9k4n2x
Welcome to Heat GPU Cloud.
# nvidia-smi
NVIDIA H100 80GB HBM3 │ 0% │ 0/80GB
 
$ python train.py --lora
AI
画像・動画・音声を作りたい?
それは Heat AI Studio(クリエイター向け)が向いてます。月¥1,980〜
Heat AI Studio を見る →
¥
余ってる GPU をお持ちですか?
RTX 4090 で 月¥18,000+、H100 なら 月¥120,000+。Heat に貸し出して収益化。
⚡ GPU を貸して稼ぐ →

こんな人のための、GPU基盤

ローカルでは足りない。クラウド大手は高い・遅い・複雑。
その間を、Heat GPU Cloud が埋めます。

01

LoRA / モデル開発者

SDXL・FLUX・Wan・HunyuanVideo の LoRA学習を H100 で爆速に。1時間¥350、学習が終わったら止めれば終わり。

02

ComfyUI ヘビーユーザー

ローカル4090じゃVRAM足りない。Comfy起動済みイメージを30秒で立てて、ブラウザでそのまま使える。

03

動画生成プロダクション

Wan2.2 / HunyuanVideo / Mochi。長尺レンダリングは H100 1枚で。完成ファイルだけ持ち帰る運用が可能。

04

LLM推論・ファインチューン

Llama 3.3 70B、Qwen2.5 72B を A100×2 / H100×1 で。vLLM・SGLang プリセット完備。

05

AI スタートアップ

サービスローンチ前のPoC・推論API化。AWS/GCPより安く、月¥10万から本番運用に乗せられる。

06

個人クリエイター

4090を買うと80万。借りれば1日¥2,000。1日10時間使っても月¥6万。買うより、借りる。

NVIDIA フルラインナップ、即起動。

RTX 4090 から H100 まで。用途に合わせて、必要な時だけ、必要な分だけ。

POPULAR
NVIDIA
RTX 4090
VRAM24 GB GDDR6X
Memory BW1.01 TB/s
FP1682.6 TFLOPS
用途ComfyUI / LoRA
¥80/ 時
NVIDIA
A100 80GB
VRAM80 GB HBM2e
Memory BW2.0 TB/s
FP16312 TFLOPS
用途LLM推論 / 学習
¥240/ 時
NVIDIA
L40S
VRAM48 GB GDDR6
Memory BW864 GB/s
FP16181 TFLOPS
用途Diffusion / 推論
¥160/ 時
* 全GPU 秒課金(1秒 = 表示価格/3,600)。停止中は課金停止。ストレージのみ月額¥0.02/GB。

$ curl 1行で、
H100 が手に入る。

ブラウザ管理画面も、CLI も、REST API も。CI/CD に組み込んで自動起動、夜間バッチ、Webhookでオートスケール — 全部できます。

REST API — Bearer Token認証、JSONレスポンス、OpenAPI仕様公開
SSH / VS Code Remote — 起動後すぐに接続、ローカル感覚で開発
Webhook — ジョブ完了・課金イベント・障害通知をSlack/Discordへ
Persistent Volume — 停止後もデータ保持、再起動で即復帰
Docker / Conda — 任意のイメージ持ち込み可、ComfyUI/PyTorchプリセット有
api.heatgpu.com — curl
# H100 を起動して ComfyUI のジョブを投げる
 
$ curl https://api.heatgpu.com/v1/jobs \
    -H "Authorization: Bearer $HEAT_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "gpu": "h100",
      "image": "comfyui:latest",
      "workflow": "wan2.2-i2v.json",
      "webhook": "https://your.app/done"
    }'
 
{
  "job_id": "job_9k4n2x",
  "status": "queued",
  "eta": "23s"
}

実際に、こう使われている。

顧客の本番ワークロード3パターン。あなたの用途も、たぶんこのどれか。

CASE_01
VIDEO GEN

動画LoRA学習+大量レンダ

キャラ専用LoRAを H100 1枚で学習(4時間)→ 100カットを夜間バッチ。終わったら自動停止、朝には完成。

月額
¥48,000
vs クラウド大手
-62%
CASE_02
LLM SERVING

Llama 3.3 70B 推論API

社内ナレッジ検索のバックエンド。A100×1 で常時稼働、Slack/業務システムから叩く。GPT-4 APIより安く・速い。

月額
¥172,000
レイテンシ
120ms
CASE_03
COMFYUI

ComfyUI ヘビー使用

個人クリエイター。RTX 4090を1日6時間、月25日。FLUX+LoRA+upscale の重いワークフローを VRAM気にせず回せる。

月額
¥12,000
vs 本体購入
-95%

シンプルな、秒課金

サブスクは不要。使った分だけ。チャージ式 or 月額確定額、お好きな方で。

PAYG
¥0/月
使った分だけ秒課金。クレカ登録のみで即起動。
  • RTX 4090 ¥80/h から
  • クレカ事後請求
  • 登録時 ¥1,000 クレジット付与
  • API・SSH・Webhook 全機能
  • メールサポート
→ Beta 申込
RESERVED
¥200k〜/月
GPU占有・月額確定。常時稼働する推論API・本番ワークロード向け。
  • GPU占有 24/365
  • 従量より 最大40%
  • 専用Slackチャンネル
  • SLA 99.5%
  • 請求書払い・年契約割引
→ 見積を依頼
* ストレージ ¥0.02/GB/月。ネットワーク転送、無料。
* 法人で 複数AIサービスを組織的に運用するなら → Heat Family

制作チームで使うなら、Heat Family

GPU基盤の上に、VOXA(ナレーション)・REPLIX(縦動画)・ANIMA(i2v動画)など9つのAIをまとめて。組織管理・SSO・監査ログ付き、月¥300,000〜。

→ Heat Family を見る

よくある質問

Q.本当に30秒で起動できますか?
RTX 4090 は平均15秒、H100 は平均23秒で起動完了します。コールドスタートでも60秒以内。プリセットイメージ(ComfyUI / PyTorch / vLLM 等)は予めキャッシュされています。
Q.停止中も課金されますか?
停止中はGPU課金は発生しません。データを保持するストレージのみ¥0.02/GB/月かかります。例:100GB保持で月¥2。
Q.AWS / GCP / RunPod と比べて何が違う?
①日本リージョン(東京/大阪)で低レイテンシ、②大手より概ね40-60%安、③ComfyUI/Wan/HunyuanVideo等のプリセットが充実、④日本語サポート、⑤Heat Family と連携した組織運用基盤あり。
Q.カスタムDockerイメージは持ち込めますか?
はい、Docker Hub / GitHub Container Registry / 自社プライベートレジストリから直接読み込めます。CUDA 12.4 ベースで構築されたイメージを推奨。
Q.複数GPUを束ねたい(H100×8など)
RESERVEDプランで対応します。8×H100 SXM5 NVLink 構成、月¥1,800,000〜。お見積はお問い合わせください。
Q.請求書払い・年契約は可能?
CREDITSプラン(¥50,000〜)と RESERVEDプランで対応。月末締め翌月末払い、年契約で最大15%引き。

GPUを叩き込む準備、
できてますか?

Console Beta 募集中。RunPod/Vast.ai より安く・速く・日本語サポート
申込フォーム送信後、48h以内にAPI key発行。