アーカイブ完了
[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations
https://arxiv.org/abs/2603.287682026年4月1日 13:26 JST•アーカイブページ・viewer・ダウンロードは、この保存版を基準に表示されます。
2026年4月1日 13:26 JST·arxiv.org
証拠パックには HTML、スクリーンショット、要約、メタデータが含まれます。Pro プランでダウンロードできます。
保存されたページ
[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations
保存時の情報つきでアーカイブHTMLを確認できます。
取得開始2026年4月1日 13:26 JST
CSS と画像を埋め込んだ保存HTMLです。元ページが削除されても開けます。
このページについてAI生成
このページは、大規模言語モデルの効率的なスケーリングに用いられるMixture-of-Experts(MoE)アーキテクチャにおける専門家レプリケーション手法に関する研究論文です。既存のレプリケーション方式が過剰なレプリケーションを行い、GPU メモリを消費することが課題です。論文で提案されるCRAFTフレームワークは、メモリ予算制約下で、層ごとの細粒度推定に基づいた効率的なレプリケーションを実現します。モデル修正や追加学習なしに既存フレームワークに統合でき、平均1.14倍(最大1.2倍)のスループット向上が確認されています。
![[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations - 保存されたスクリーンショット](https://pub-f6fa8ca7bebe4069bff3224f9a8f5334.r2.dev
/screenshots/89fd2c77a519d474.jpg)