アーカイブ完了

[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations

https://arxiv.org/abs/2603.28768
2026年4月1日 13:26 JSTアーカイブページ・viewer・ダウンロードは、この保存版を基準に表示されます。
2026年4月1日 13:26 JST·arxiv.org

証拠パックには HTML、スクリーンショット、要約、メタデータが含まれます。Pro プランでダウンロードできます。

保存されたページ

[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations

保存時の情報つきでアーカイブHTMLを確認できます。

取得開始2026年4月1日 13:26 JST

CSS と画像を埋め込んだ保存HTMLです。元ページが削除されても開けます。

このページについてAI生成

このページは、大規模言語モデルの効率的なスケーリングに用いられるMixture-of-Experts(MoE)アーキテクチャにおける専門家レプリケーション手法に関する研究論文です。既存のレプリケーション方式が過剰なレプリケーションを行い、GPU メモリを消費することが課題です。論文で提案されるCRAFTフレームワークは、メモリ予算制約下で、層ごとの細粒度推定に基づいた効率的なレプリケーションを実現します。モデル修正や追加学習なしに既存フレームワークに統合でき、平均1.14倍(最大1.2倍)のスループット向上が確認されています。

スクリーンショット
[2603.28768] CRAFT: Cost-aware Expert Replica Allocation with Fine-Grained Layerwise Estimations - 保存されたスクリーンショット

ページ全体を最大15,000pxの高さまで撮影しています。必要に応じて全体像を確認できます。