Kimi K2.7 Code とは・使い方|1T MoE のオープンコーディングモデルを実例解説【2026年版】
この記事でわかること
- Kimi K2.7 Code とは:Moonshot AI が2026年6月12日に公開した、コーディング特化のオープンウェイトモデル(Modified MIT)
- 構成:1T 総パラメータの MoE(1 token あたり 32B 活性 / 384 エキスパート中 8+共有1)。256K コンテキスト・画像/動画入力対応
- 性能:Moonshot 自社ベンチで前世代 K2.6 比 Kimi Code Bench v2 +21.8% 等。ただし SWE-bench 等の独立第三者ベンチはまだ無い(=ベンダー公表値として読む)
- 使い方:API(model id `kimi-k2.7-code`、入力 $0.95・出力 $4.00 /1M、cache hit は $0.19)か、HuggingFace の重み(約595GB、INT4 量子化あり)
- 注意:thinking モードは必須(無効化するとAPIエラー)。重みは約595GBで個人PCでは現実的でなく、実運用は API/クラウドが基本
結論:Kimi K2.7 Code は「1T MoE のオープンなコーディング特化モデル」
Kimi K2.7 Code は、中国の Moonshot AI が 2026年6月12日 に公開した、コーディングに特化したオープンウェイトモデルです。1T(1兆)総パラメータの MoE で、1 token あたり実際に動くのは 32B だけ。256K の長いコンテキストを持ち、リポジトリ横断のような長時間のエージェント的開発を狙っています。重みは HuggingFace に Modified MIT で公開されています。
この記事は公開直後の一次情報に基づく整理です。ベンチマークは現状すべて Moonshot 自社公表値で、独立第三者の検証はまだ出ていません。その前提で読んでください。
アーキテクチャ:MoE(1T 総 / 32B 活性)
K2.7 Code は典型的な大規模 MoE(Mixture of Experts) です。
| 項目 | 値 |
|---|---|
| 総パラメータ | 約 1T(1兆) |
| 活性パラメータ(1 token) | 約 32B |
| エキスパート | 384(うち 1 token で 8 + 共有1 を使用) |
| レイヤー | 61(うち 1 dense) |
| コンテキスト | 256K(262,144 トークン) |
| マルチモーダル | MoonViT 視覚エンコーダ +400M(画像/動画入力) |
総 1T でも推論時に動くのは 32B 分だけ——という スパース活性化 が、巨大な知識容量と現実的な推論コストを両立させています(仕組みは MoEとは で解説)。注意点:活性が32Bでも、重み全体(約595GB)をメモリに載せる必要があるため、ローカル実行のハードルは高いままです。
性能:ベンダー公表値(独立検証はまだ無い)
Moonshot が公表した、前世代 K2.6 との比較値です。
| ベンチ | K2.6 | K2.7 Code | 改善 |
|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | +21.8% |
| Program Bench | 48.3 | 53.6 | +11.0% |
| MLS Bench Lite | 26.7 | 35.1 | +31.5% |
加えて、reasoning(思考)トークンの消費が K2.6 比 約30%減 とされています。
⚠️ 重要:上表はすべて Moonshot の第一者ベンチ です。2026年6月時点で SWE-bench Verified / Terminal-Bench / LiveCodeBench などの独立第三者結果は公表されていません。「自社ベンチで前世代より伸びた」までが確かな事実で、他社モデルとの横並び比較は独立ベンチが出るまで保留が安全です。多くの紹介記事がベンダー値を“検証済み”のように扱うので、ここは区別して読みます。
使い方
1) API(最短)
model id は kimi-k2.7-code。料金は 入力 $0.95 / 1M(キャッシュ命中時 $0.19)、出力 $4.00 / 1M。OpenAI 互換クライアントから使える場合が多く、普段のコーディングエージェント設定に差し込んで同一タスクで比較するのが手軽です。
2) オープンウェイト(HuggingFace)
重みは HuggingFace で Modified MIT 公開。フルサイズ 約595GB、native INT4 量子化 版あり。"Modified" は標準 MIT に追加条件が付くため、商用前に原文確認を。
3) 制約:thinking 必須・sampling 固定
- thinking モード必須:無効化すると API エラー。常に「考えてから答える」前提のモデル。
- サンプリング固定:temperature=1.0 / top_p=0.95。
この「推論常時オン」は近年の推論モデルに共通の流れです(制御の考え方は Claude Code の thinking / effort を参照)。
ローカル実行の現実
「オープンウェイト=手元で動く」と早合点しないこと。約595GB(INT4でも数百GB級) の重みをロードする必要があり、個人PCでの常用は非現実的です。現実解は API、もしくは十分な GPU を備えた クラウド/サーバ。手元で軽く LLM を試すなら、小型モデルを Ollama で動かすほうが現実的です。
立ち位置(他モデルとの比較観点)
- 強み:オープンウェイト+コーディング特化+長コンテキスト。自前ホスティング・統制が効く。DeepSeek 系と同じく「中国製オープンコーディングモデル」の選択肢が増えた形。
- 弱み/未知:独立ベンチが無く客観比較が難しい。巨大で手元実行は重い。
- 実務の決め方:普段の Claude Code / Cursor 等と 同一タスクで出力を並べ、コスト・速度・正確性を自分のコードベースで実測してから採否を決める(Claude Code と Cursor)。
まとめ
- Kimi K2.7 Code=Moonshot の オープン(Modified MIT)コーディング特化 MoE(2026-06-12 公開)
- 1T 総 / 32B 活性 / 384 experts / 256K ctx、画像・動画入力対応
- 性能は 自社ベンチで K2.6 比 +21.8% 等(独立第三者ベンチは未発表=公表値として読む)
- 使い方:API(
kimi-k2.7-code、入力$0.95・出力$4.00/1M)or HuggingFace(約595GB・INT4)。thinking 必須・sampling 固定 - 手元実行は重い → 実運用は API/クラウド。採否は自分のコードベースで実測
新しいモデルを実務で評価する力をつける:当サイトの「バイブコーディング実践編」では、AIコーディングツール/モデルを業務に組み込み、出力を評価・運用する手順を提出物テンプレ + 採点ルーブリック付きの演習で扱います。4週間限定で無料公開中。
関連ガイド:
- MoE(Mixture of Experts)とは — K2.7 Code の 1T/32B 活性を支える仕組み
- Ollama の使い方 — 小型モデルを手元で動かす現実的な選択肢
- Claude Code の thinking / effort — 「推論常時オン」モデルの制御の考え方
- Claude Code と Cursor はどっち — 普段使いツールと比較評価する観点
関連する AI 研修コース・事例
このガイドで解説した内容を、提出物・採点ルーブリック付きの実装演習で 実務レベルまで定着させるためのコースと、国内外の AI 活用事例を見るための入口です。
- バイブコーディング実践編 (vibe_practice)Claude Code を業務コードに使うときの安全設定・許可コマンド・ ログ管理を、提出物付き 40 レッスンで体系化。4 週間限定で無料公開中。
- AIエージェント活用実践編 (agent_practice)Claude Agent SDK と MCP で AI を働かせる実装演習。 Claude Code に慣れた次のステップ。
- サイバーセキュリティ基礎 (cybersec_basic)AI を業務に取り入れる際の社内ガードレール・情報統制と一緒に学ぶ 実務者向けセキュリティ 40 レッスン。
- AI 活用事例集KDDI・SAP・freee・メルカリ等、国内外の企業 AI 導入実例を業種別に確認。
- AI研修 コース一覧概論レーン (経営者向け) + 実践レーン (エンジニア向け) の全 6 コースを一覧。