大規模モデルデータエンジニアリング¶
翻訳作業中
日本語版は中国語 2026 年版より 19 章遅れています。最新の構成は中国語版を参照してください。章ごとの状況は翻訳状況ページを確認してください。
現在の版の状態¶
中国語 2026 年版が本書の主版です。現在は 28 章と 10 本の実行可能なプロジェクト章を含みます。
日本語版は更新作業中で、最新の中国語版の目次とはまだ同期していません。古い目次を最新版として見せないため、このページは翻訳状況の入口として扱います。
最新中国語版の範囲¶
- 第1部:総論とインフラ
- 第2部:テキスト事前学習データエンジニアリング
- 第3部:マルチモーダルデータエンジニアリング
- 第4部:指示ファインチューニングと嗜好データ
- 第5部:合成データエンジニアリング
- 第6部:推論と Agent データエンジニアリング
- 第7部:アプリケーションレベルのデータエンジニアリング
- 第8部:データ運用とプラットフォーム構築
- 第9部:プライバシーコンプライアンスとデータセキュリティ
- 第10部:実践プロジェクト