KubeCon Europe 2025、エッジでAIを実行するKubeEdge Sednaのセッションを紹介

2025年5月29日(木)
松下 康之 - Yasuyuki Matsushita
KubeCon EU 2025、エッジでAIを実行するKubeEdge Sednaのセッションを紹介する。

KubeCon+CloudNativeCon Europe 2025の併催イベントCloud Native+Kubernetes AI Dayで行われた、エッジとクラウドで推論を分担させる仕組みについて解説したセッションを紹介する。これは「Manage Cloud Native Workloads Across Edge and Cloud Seamlessly Using KubeEdge and WasmEdge」と題されたセッションで、プレゼンターはWasmEdgeの開発元として知られているSecond StateのVivian Hu氏とHuawei CloudのFei Xu氏だ。

プレゼンテーションを行うHu氏(左)とXu氏(右)

プレゼンテーションを行うHu氏(左)とXu氏(右)

最初に解説したのは「どうして推論をエッジ側で行う必要があるのか?」についてである。

エッジで推論を実行する必要性について解説

エッジで推論を実行する必要性について解説

ここではエッジ側で推論を実行することでレイテンシーをなくせること、データがエッジ側から出ないことでプライバシーを確保できること、アプリケーションに特化したカスタマイズができること、そしてスケーラビリティなどを挙げている。アプリケーションに特化したという部分では、スマートアグリカルチャーが例として挙げられているのが興味深い。これの実装の例としては、GoogleのTensorFlowを使ってキュウリの選別に機械学習を使ったユースケースが当てはまるだろう。2016年にGoogleのブログで紹介されたこの実装例ではクラウドの使用は必須だったが、それをクラウドを使わずエッジでできるようにすることでコストを抑えることが可能となる。コストに関してはHu氏は言及していないが、レイテンシーやプライバシーとは違う観点でビジネスオーナーにとっては大きな要点だろう。

●参考:キュウリの自動選別:キュウリ農家とディープラーニングをつなぐ TensorFlow

一方、エッジでの推論における課題として、ハードウェアに関する制約、モデルを小さくすることと性能のトレードオフ、クラウドとは異なりモデルやミドルウェア、ツールなどのエコシステムが多様化し過ぎることなどを挙げた。

エッジ側で機械学習アプリケーションを実行する際の課題

エッジ側で機械学習アプリケーションを実行する際の課題

次のスライドでは、エッジでの推論の実装について必要な特性について説明した。ここでは前のスライドの課題を解決するという内容になっており、軽量であること、どのプラットフォームでも実行可能な移植性を備えること、エッジとクラウドが連携できること、そしてクラウドに対応していることなどを挙げている。3つ目のエッジとクラウドの連携については軽量なアプリケーションはエッジ側で、負荷が高いアプリケーションはクラウド側で実行することで、エッジとクラウドが分担することを説明しているが、この特徴は後述のHuawei Cloudでのデモアプリケーションでの実装と合致していると言える。

エッジで必要となる特性について解説

エッジで必要となる特性について解説

Hu氏はSecond Stateが開発をリードしているWasmEdgeについて解説。WasmEdgeはCNCFのインキュベーションプロジェクトであり、軽量高速なWebAssemblyランタイムで多くのユースケースを中国企業において持っていることが特徴的なソフトウェアだ。Second StateのCEOであるMichael Yuan氏は中国出身で、Second Stateは開発部門を中国にも持っていることから中国企業での採用が多いのは納得できる。実際にWasmEdgeのユースケースのページには多くの中国企業が社内ユースとしてWasmEdgeを使っていることがわかる。

●参考:WasmEdge Users and Collaborators

WasmEdgeについて解説。WASMのランタイムの一つだが、中国企業での導入例が多い

WasmEdgeについて解説。WASMのランタイムの一つだが、中国企業での導入例が多い

WasmEdgeはWASMのランタイムだが、近年は大規模言語モデルの実行のためのランタイムという訴求にシフトしており、2024年に香港で行われたKubeCon ChinaでもYuan氏がプレゼンテーションを行っていた。

●参考:KubeCon China 2024から、ローカルでLLMを実行するSecond Stateのセッションを紹介

WasmEdgeの特徴としては、軽量かつCPU/GPU/TPU/NPUなどの各種プロセッサで実行できることなどを挙げた。そしてLlamaEdgeについても紹介し、OpenAI互換のAPIを持ち多くのモデルを実行できることを特徴として挙げた。

LlamaEdgeの紹介

LlamaEdgeの紹介

ここからはHuawei CloudのXu氏にバトンタッチしてLlamaEdgeについて解説を行うターンとなった。

KubeEdgeのアーキテクチャーなどを解説

KubeEdgeのアーキテクチャーなどを解説

KubeEdgeはエッジとクラウドが連携してコンテナアプリケーションを実行するためのソフトウェアだが、KubeEdgeをベースにLLMの実行にカスタマイズしたのがKubeEdge Sednaという新しいソフトウェアという理解で正しいだろう。

KubeEdge Sednaの紹介

KubeEdge Sednaの紹介

KubeEdge Sednaではクラウドとエッジがそれぞれモデルを持ち、推論を行うことが図式化されている。クラウド側にGlobal Managerと呼ばれるソフトウェアが配備され、クラウドとエッジのノードを管理し、それぞれのLocal Controllerと連携して実行されるという。

クラウドとエッジが協調して推論を行う

クラウドとエッジが協調して推論を行う

ここではクラウドとエッジが協調して推論を行うモデルが解説されているが、興味深いのはエッジ側での推論は浅い(小規模)モデルを使い、その結果が満足できるレベルに達しない場合にクラウド側の深い(大規模)モデルで推論を行うという協調の仕組みだ。このスライドでは「Confidence Level」という用語で示されているが、推論した結果が信頼できるレベルに達しない場合、クラウド側のより大容量のモデルで推論を行うということになる。これはこの後のデモでも示されている内容だ。

エッジとクラウドのマニフェストにそれぞれ異なるモデルが定義されている

エッジとクラウドのマニフェストにそれぞれ異なるモデルが定義されている

このスライドではKubernetesのマニフェストが例示され、エッジとクラウドでそれぞれ違うコンテナイメージが指定され、それぞれ小規模なモデル、大規模なモデルが定義されているのがわかる。

KubeEdgeとWasmEdgeベースのLlamaEdgeのアーキテクチャー図

KubeEdgeとWasmEdgeベースのLlamaEdgeのアーキテクチャー図

この後、Huawei CloudのXu氏は動画を使ってエッジ側とクラウド側で実装されたイメージデータから画像認識を行うデモを見せた。

最初のデモではWasmEdgeを使ってLLMをエッジに実装するようすを動画で紹介

最初のデモではWasmEdgeを使ってLLMをエッジに実装するようすを動画で紹介

ここでのデモは建設現場の写真から作業員がヘルメットを装着しているかどうかを判定するというもので、実際にエッジ側だけの推論ではConfidence Levelが低いケースにおいて、クラウド側でも推論を行うことでより正確な画像認識が可能になったということを見せた。

画像認識をエッジ側とクラウド側で実行し、結果を比較

画像認識をエッジ側とクラウド側で実行し、結果を比較

デモでは同じ画像に対してエッジとクラウドで画像認識を行い、より精度を上げることが可能であることを示している。これは実際のアプリケーションとして稼働しているのか、PoCとしての実装なのか、単なるデモアプリケーションなのかは解説されなかったが、同じ画像に対しての精度が変化していることを見せた内容となった。往々にして中国の企業が行うデモは、いろいろな物が省略されて結果だけを提示する、いわゆるお料理番組風の内容になっていることがある。実際このデモも、クラウドとエッジで協調する際のレイテンシーと品質のトレードオフの詳細などには触れられていなかったのが残念なポイントだと言えるだろう。

また運用の観点ではエッジ側の可用性やオブザーバビリティについても特に言及がなかった。2025年6月に行われるKubeCon Chinaでは多くの中国企業のセッションが行われると思われ、今回のHuawei Cloudのデモについてもより詳細に解説を聴く機会があることを期待したい。

●参考:https://kubeedge.io/docs/subproject/sedna/

著者
松下 康之 - Yasuyuki Matsushita
フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

AI・人工知能イベント
第3回

KubeCon Europe 2025、エッジでAIを実行するKubeEdge Sednaのセッションを紹介

2025/5/29
KubeCon EU 2025、エッジでAIを実行するKubeEdge Sednaのセッションを紹介する。
開発ツールイベント
第2回

KubeCon Europe 2025からBloombergによるLLMをKserveで実装するセッションを紹介

2025/5/22
KubeCon Europe 2025からBloombergによるLLMをKserveで実装するセッションを紹介する。
クラウドイベント
第1回

KubeCon+CloudNativeCon Europe 2025開幕、Kafkaのリバランス問題を解決するセッションを紹介

2025/5/12
KubeCon+CloudNativeCon Europe 2025から、Kafkaのリバランス問題を解決するCruise Controlのセッションを紹介。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています