缩写表¶

本页统一列出全书高频专业术语缩写，便于跨篇阅读时快速检索。

通用缩写¶

缩写	英文全称	中文说明	主要出现篇章
A100	NVIDIA A100 GPU	英伟达 A100 加速卡	第一篇、第十篇、第十一篇
AI	Artificial Intelligence	人工智能	全书
AGI	Artificial General Intelligence	通用人工智能	第一篇、第十一篇
API	Application Programming Interface	应用程序编程接口	第一篇、第四篇、第十篇、第十一篇
ANN	Approximate Nearest Neighbor	近似最近邻检索	第一篇、第七篇
ASR	Automatic Speech Recognition	自动语音识别	第三篇
BM25	Best Matching 25	经典稀疏检索排序方法	第一篇、第七篇
CI/CD	Continuous Integration / Continuous Deployment	持续集成 / 持续部署	第一篇、第二篇、第八篇
CPU	Central Processing Unit	中央处理器	第一篇、第二篇
CSV	Comma-Separated Values	逗号分隔文本格式	第一篇
ETL	Extract, Transform, Load	抽取、转换、加载	第一篇、第八篇
GPU	Graphics Processing Unit	图形处理器	第一篇、第三篇、第十篇、第十一篇
GUID	Globally Unique Identifier	全局唯一标识符	第二篇
HDFS	Hadoop Distributed File System	Hadoop 分布式文件系统	第一篇、第十篇
H100	NVIDIA H100 GPU	英伟达 H100 加速卡	第一篇
JSON	JavaScript Object Notation	结构化数据交换格式	第一篇、第三篇、第四篇、第十篇、第十一篇
JSONL	JSON Lines	按行存储 JSON 的文本格式	第一篇、第三篇、第四篇、第十篇
KPI	Key Performance Indicator	关键绩效指标	第四篇、第八篇
LLM	Large Language Model	大语言模型	全书
MLOps	Machine Learning Operations	机器学习工程运维体系	第一篇、第八篇
PDF	Portable Document Format	便携式文档格式	第一篇、第三篇、第七篇、第十篇、第十一篇
PII	Personally Identifiable Information	个人身份识别信息	第二篇、第九篇、第十篇
ROI	Return on Investment	投资回报率	第一篇、第八篇
SLA	Service Level Agreement	服务级别协议	第一篇、第四篇、第八篇
SOPs	Standard Operating Procedures	标准操作规程	第四篇、第八篇
SQL	Structured Query Language	结构化查询语言	第一篇、第四篇、第十一篇
TPU	Tensor Processing Unit	张量处理器	第一篇
UTF-8	8-bit Unicode Transformation Format	8 位 Unicode 转换格式	第二篇

数据工程与平台¶

缩写	英文全称	中文说明	主要出现篇章
DataOps	Data Operations	数据运营与数据工程运维体系	第二篇、第八篇、第十篇
DOM	Document Object Model	文档对象模型	第三篇、第十一篇
DVC	Data Version Control	数据版本控制工具 / 方法	第一篇、第二篇、第八篇
FAISS	Facebook AI Similarity Search	向量相似度检索库	第七篇
FastText	FastText	轻量文本表示与分类工具	第二篇
LakeFS	LakeFS	面向数据湖的版本管理系统	第一篇、第八篇
MATTR	Moving-Average Type-Token Ratio	移动平均词型-词次比指标	第二篇
MFU	Model FLOPs Utilization	模型浮点运算利用率	第二篇
MinHash	Min-wise Independent Permutations Hashing	最小哈希近似去重方法	第一篇、第二篇、第十一篇
OOM	Out Of Memory	内存溢出	第一篇、第二篇
PPL	Perplexity	困惑度指标	第一篇、第二篇、第四篇
RDMA	Remote Direct Memory Access	远程直接内存访问	第一篇
ReDoS	Regular Expression Denial of Service	正则拒绝服务风险	第二篇
TTR	Type-Token Ratio	词型-词次比，多样性指标	第二篇
WARC	Web ARChive	网页归档格式	第二篇
WebDataset	WebDataset	面向大规模训练的数据打包格式 / 工具	第二篇、第三篇

训练、对齐与推理¶

缩写	英文全称	中文说明	主要出现篇章
CoT	Chain-of-Thought	思维链	第六篇、第十篇、第十一篇
DPO	Direct Preference Optimization	直接偏好优化	第四篇、第十一篇
LoRA	Low-Rank Adaptation	低秩适配微调方法	第十一篇
PPO	Proximal Policy Optimization	近端策略优化	第四篇、第十一篇
PRM	Process Reward Model	过程奖励模型	第四篇、第六篇、第十篇、第十一篇
QA	Quality Assurance	质量保障	第四篇、第十篇
RAG	Retrieval-Augmented Generation	检索增强生成	第七篇、第十篇
RL	Reinforcement Learning	强化学习	第四篇、第十一篇
RLAIF	Reinforcement Learning from AI Feedback	基于 AI 反馈的强化学习	第四篇
RLHF	Reinforcement Learning from Human Feedback	基于人类反馈的强化学习	第四篇、第十一篇
RM	Reward Model	奖励模型	第四篇
ROUGE-L	Recall-Oriented Understudy for Gisting Evaluation - Longest Common Subsequence	基于最长公共子序列的文本相似度指标	第二篇、第四篇
SFT	Supervised Fine-Tuning	监督微调	第四篇、第十篇、第十一篇

多模态与视觉¶

缩写	英文全称	中文说明	主要出现篇章
BBox	Bounding Box	边界框	第三篇、第十篇、第十一篇
ChartQA	Chart Question Answering	图表问答任务 / 数据集	第三篇、第十一篇
CLIP	Contrastive Language-Image Pre-training	对比式图文预训练模型	第三篇、第十一篇
CLIP-Score	CLIP Score	基于 CLIP 的图文相关性评分	第十一篇
COCO	Common Objects in Context	通用目标检测与图像描述数据集	第三篇、第十篇
DINO	DEtection TRansformer with Improved deNoising anchOr boxes	一类检测模型名称，常见于 Grounding DINO	第三篇、第十一篇
DocVQA	Document Visual Question Answering	文档视觉问答任务 / 数据集	第十一篇
Grounding	Visual Grounding	视觉定位 / 对齐任务	第三篇、第十篇、第十一篇
IoU	Intersection over Union	目标检测重叠度指标	第三篇
LLaVA	Large Language and Vision Assistant	多模态大模型 / 数据格式名	第十篇、第十一篇
OCR	Optical Character Recognition	光学字符识别	第三篇、第七篇、第十篇、第十一篇
OCR-Rich	OCR-Rich Data	富含文字识别信息的图像 / 文档数据	第十一篇
SSIM	Structural Similarity Index Measure	结构相似性指标	第十一篇
ViT	Vision Transformer	视觉 Transformer 编码器	第十一篇
VLM	Vision-Language Model	视觉语言模型	第三篇、第十一篇
VQA	Visual Question Answering	视觉问答	第三篇、第十一篇
XML	eXtensible Markup Language	可扩展标记语言	第一篇、第三篇
YOLO	You Only Look Once	目标检测模型系列	第三篇

评测、合规与治理¶

缩写	英文全称	中文说明	主要出现篇章
AGI-Eval	AGI Evaluation	面向通用智能能力的评测基准	第十一篇
DPIA	Data Protection Impact Assessment	数据保护影响评估	第九篇
GSM8K	Grade School Math 8K	小学数学推理评测集	第一篇、第十一篇
MCTS	Monte Carlo Tree Search	蒙特卡洛树搜索	第十一篇
MMLU	Massive Multitask Language Understanding	大规模多任务语言理解评测集	第一篇、第十一篇
MMMU	Massive Multi-discipline Multimodal Understanding and Reasoning	多学科多模态理解与推理评测集	第十一篇
NSFW	Not Safe For Work	不适宜公开场景内容	第二篇
P99	99th Percentile	第 99 百分位指标	第二篇
P99.9	99.9th Percentile	第 99.9 百分位指标	第二篇
RoPA	Record of Processing Activities	处理活动记录	第九篇