KubeCon China 2025開催、中国ベンダーによるキーノートを紹介

連載 [第2回] :

KubeCon＋CloudNativeCon China 2025レポート

2025年9月8日(月)

KubeCon China 2025における中国ベンダーによるキーノートを紹介する。

KubeCon＋CloudNativeCon China 2025は、パンデミックが発生する以前には上海で開催されていたが、パンデミック以降は香港に場所を移して2024年から再開された。2019年6月開催、つまり世界的な新型コロナウイルスによってロックダウン状態になる直前に開催された上海でのKubeCon China 2019は以下の連載を参考にして欲しい。

●参考：KubeCon China 2019レポート記事一覧

会場の規模は2019年に比べて小さくはなっているが、2025年のカンファレンスにおいて語られた内容は、クラウドネイティブに加えて生成AIの実装と運用というのが主なテーマだ。中国という巨大な市場を相手にクラウドネイティブなシステム上で生成AIのための膨大なGPUクラスター運用のために、中国国内で開発されたオープンソースソフトウェアなどが紹介される状況となっている。隔離された巨大な大陸で独自に進化した生物を確認するといういわば、ガラパゴス大陸を観察するという感覚すら覚えるカンファレンスと言える。そのガラパゴス大陸の一端を初日のキーノートの後半部分から紹介する。

最初に紹介されたのは、CNCFのプロジェクトとして徐々に話題になりつつあるCrossplaneだ。プレゼンテーションを行ったのはOdyssey CloudのAmit Dsouza氏とNirmataのCortney Nickerson氏だ。

Crossplaneの紹介を行うNickerson氏（左）とDsouza氏（右）

CrossplaneはIaC（Infrastructure as Code）を実現するインフラストラクチャー構成管理のためのオープンソースソフトウェアで、HashiCorpが開発したTerraformとよく比較される。TerraformとCrossplaneの違いは以下のCrossplaneの公式サイトにある比較が参考になるだろう。

●参考：Crossplane vs Terraform

Crossplaneを推奨する前にTerraformにおいて何が問題か？を整理するスライドを使って解説。ここではIaCを実現するツールが多過ぎて何を使えば良いのかわからないというツール選択の問題から、複数のエンジニアによるインフラストラクチャー変更によってドリフト（変更が衝突してしまう状態）が発生してしまう問題などを挙げて、シンプルなインフラストラクチャーでは問題にはならないが、徐々にスケールが大きくなると発生しがちな問題点を挙げて解説した。

セッションの動画は以下から視聴できる。

●動画：Keynote: Crossplane Is the Answer! but What Is the Question?

IaCにおける問題点を整理。変更がドリフトしてしまう問題などを挙げた

またそれらの問題点に加えて、クラウドネイティブなシステムにおけるコアなプラットフォームであるKubernetesネイティブであるかどうか？を問題点として挙げている。

クラウドネイティブにおいてKubernetesネイティブかどうかは大きな問題点

そしてCrossplaneはKubernetesネイティブなコントロールプレーンだと紹介。単一のAPIとリコンサイレーションループというKubernetesの基本思想に合致したソフトウェアであることを説明した。

さらに構成管理をGitに集約するGitOpsの考えに沿ってシステムを構成した場合、CNCFがホストするオープンソースですべての部分をカバーできることを強調。ここではTerraformからフォークしたOpenTofuは無視されているのは致し方ないだろう。

GitOpsで構成管理全体を実装した場合の中核となるCrossplane

ここからは動画によるデモでOpenTofuとの比較などを見せた。リアルに操作するのではなく動画を使って静的サイトのデプロイメントをそれぞれのツールで行うことなどで違いを見せようとしたが、成功したかと言えば難しい内容となった。そして将来計画としてv2の概要を解説。さらにKubernetesネイティブであることを推進するとともに、ポリシーやチーム向けのアクセスコントロールなどを紹介してセッションを終えた。

Crossplane v2の概要を解説

ここまでが英語圏のプレゼンターによるキーノートとして行われ、次からは主に中国企業からの登壇者が中国国内のユースケースや実装例、つまりガラパゴス大陸の状況を解説する内容に移った。

最初に登壇したのはこのカンファレンスの最上位のスポンサーであるHuaweiのBill Ren（Ren Xudong）氏だ。

●動画：Towards Clouds of AI Clusters

登壇したHuaweiのBill Ren（Ren Xudong）氏

Ren氏は蒸気機関の登場から大規模言語モデル（LLM）の登場までを進化の速度と相対させて解説を行い、革新的発明が実際に社会を変革させる実装に至るまでの期間が短くなっていることからLLMが大きな変化を社会に与えるだろうと語った。

蒸気機関からLLMまでを見渡して、発明が社会にインパクトを与えるまでの時間が短縮されていると説明

そしてOpenEuler、Volcano、Karmada、KubeEdge、openFuyaoと言ったHuaweiが重要と考えているであろうオープンソースソフトウェアについて、スライドを使って説明を行った。OpenEulerはHuaweiが開発したLinuxのディストリビューションでOpen Atom Foundationという中国の非営利団体によって開発が行われているソフトウェアだ。Open Atom Foundationは前半のJim Zemlin氏のプレゼンテーションでも紹介されている。VolcanoはKubernetes上のバッチスケジューリング、KarmadaはKubernetesのマルチクラスター管理のためのソフトウェアで、これも元はHuaweiが開発し、CNCFに寄贈されサンドボックスとして開発されている。KubeEdgeはKubernetesクラスターからエッジに拡張するためのソフトウェアでクラスターと連携してエッジでのアプリケーション実行を可能にするソフトウェア、openFuyaoは中国語のサイトからの翻訳によればOpenEulerをベースにしたKubernetesとAIのためのプラットフォームらしい。2025年6月の段階では完全にはオープンソースとはなっておらず、2025年9月（Q3）以降にオープンソースとして公開が予定されているという。

openFuyaoの解説スライド。右下に小さく2025年Q3にOSS化されると記述されている

このセッションはHuaweiが開発したOpenEuler、KubeEdge、Karmadaに加えてVolcano、openFuyaoが中国においてメインストリームなソフトウェアであるとHuaweiのOSSのトップが考えているということを知らしめる内容であり、英語圏の参加者よりも中国のエンジニアに認知させるという目的であったように思われる。

生成AIをエッジで動かす例を紹介するMichael Yuan氏

次に登壇したのはSecondStateのCEO、Michael Yuan氏だ。ここではWasmEdgeのメインテナーとして紹介されている。

●動画：An Optimized Linux Stack for GenAI Workloads

Yuan氏のプレゼンテーションは生成AIを実行するハードウェアが多様化し、ハードウェアごとのソフトウェアライブラリーとの組み合わせによってデベロッパーがそれぞれのプロセッサごとの実行モジュールを開発しなければならない状態に問題であると説明し、それを解決する方法を解説する内容となった。ハードウェアの例としてNVIDIA、Intel、AMD、そしてQualcommなどが挙げられている。

AIを実行するためのハードウェアが多様化していることの問題を解説

//image[3849262][ //}

その解決策として提案しているのが、AIサイドカーという方法だ。

AIサイドカーによって機種間の相違を吸収する方法論を提案

ただし実際の実装としては使われるコンポーネントが増えることで処理時間が長くなることを指摘。ここでは機種間の相違を吸収するという利点に対してレイテンシーが増えてしまう欠点を整理している。

複数のコンポーネントを使うことでレイテンシーが増えてしまう欠点

//image[3849264][ //}

サイドカーの欠点をリストで紹介

その欠点を解消するために紹介したのが、WasmEdgeというWASMのランタイムだ。このランタイムとAIのモデルを組み合わせることで、高速な実行を実現できるというのがYuan氏の結論だ。

WasmEdgeによって高速なモデル実行が可能になると説明

ちなみにこのスライドでWasmEdgeのユースケースとして紹介されている5milesは、2日目のセッションでSecondStateのVivian Hu氏とYi Lv氏によって解説されている。5milesは中国の中古品売買サイトで、品物の紹介のための動画をWasmEdgeのAIサイドカーによって処理しているという内容だ。中国語のプレゼンテーションだが、参考にはなるだろう。

●動画：We Save $900 per Day with Self-Hosted AI: Building Scalable Local LLM Infrastructure

次に登壇したのはiFLYTEKのエンジニア、Dong Jiang氏とHuawei Cloudのエンジニア、Xuzheng氏によるVolcanoのセッションだ。このセッションは中国語で行われているため詳しい内容は理解が難しいが、スライドは英語で表記されているため、ある程度の概要は理解できる。

●動画：Scaling Model Training with Volcano: iFlytek's Kubernetes Breakthrough（中国語）

Volcanoを使ってKubernetes上でバッチジョブをスケジューリング

このセッションではiFLYTEKの複数のグループから実行されるトレーニングジョブをクラスター内のサーバーに効率的にスケジューリングする内容を解説している。Binpack、Gang Schedulingなどのキーワードも示されている。

複数のグループからのジョブを効率的にスケジューリングするVolcano

結果として実行効率が40％アップし、故障からのリカバリー時間が70％減少、リソースも50％削減が可能になったと解説されている。GPUクラスターの障害率が高いのは2024年のKubeCon Chinaでも紹介されていたが、ここでもそれがポイントになっていることが確認できたと言える。

●参考：KubeCon China 2024、GPUの故障を検知するOSSを解説するセッションを紹介

そしてVolcanoの将来についても簡単に解説を行った。マルチクラスター、マルチテナントなどのキーワードがあることでわかるように、中国ではB2C向けには巨大なクラスターをマルチテナント対応として効率良く実行する必要性が高いことが見てとれる。またDRA（Dynamic Resource Allocation）への対応も予定されているようだ。

Volcanoの将来計画を解説

最後のプレゼンテーションはDaoCloudの創業者でCEOのRoby Chen氏と香港の研究機関であるHongKong Generative AI Research & Development Center（HKGAI）のAaron Xu博士によって行われた。

DaoCloudのCEO、Chen氏（左）とHKGAIのAaron Xu博士（右）

●動画：The Future of AI in Hong Kong: From Local Innovation to Global Influence

内容としては、香港における最初の実装例としてDaoCloudのインフラストラクチャーを使ってDeepSeek-685Bというモデルをベースにした大規模言語モデルを開発したことを紹介。ここでは特にオープンソースであり、政府と教育機関向けの実装例であることを強調している。

香港で最初の独自のLLMを実装したことを紹介

また香港が主権を持つLLMであることを強調。ここではデータ、モデル、実行環境、ガバナンスにおいて主権が香港にあることを解説している。

香港に主権があることをデータ、モデル、実行環境、ガバナンスの点で解説

この7分という短いセッションでは香港の学術機関と政府、そしてDaoCloudが協同でLLMを実装したということだけを印象付ける内容となったが、生成AIのガバナンスについてはさまざまな観点から議論が続けられている状況で香港の方針を明確にしたという意味では中国からの参加者にとっては価値のある内容だったように思われる。

後半はHuaweiとDaoCloudのためのステージという内容で、どちらもユースケースを使って着実に生成AIを実用に使っていることを解説しており、その存在感を充分に発揮したキーノートとなった。