缩写表
本页统一列出全书高频专业术语缩写,便于跨篇阅读时快速检索。
通用缩写
| 缩写 |
英文全称 |
中文说明 |
主要出现篇章 |
| A100 |
NVIDIA A100 GPU |
英伟达 A100 加速卡 |
第一篇、第十篇、第十一篇 |
| AI |
Artificial Intelligence |
人工智能 |
全书 |
| AGI |
Artificial General Intelligence |
通用人工智能 |
第一篇、第十一篇 |
| API |
Application Programming Interface |
应用程序编程接口 |
第一篇、第四篇、第十篇、第十一篇 |
| ANN |
Approximate Nearest Neighbor |
近似最近邻检索 |
第一篇、第七篇 |
| ASR |
Automatic Speech Recognition |
自动语音识别 |
第三篇 |
| BM25 |
Best Matching 25 |
经典稀疏检索排序方法 |
第一篇、第七篇 |
| CI/CD |
Continuous Integration / Continuous Deployment |
持续集成 / 持续部署 |
第一篇、第二篇、第八篇 |
| CPU |
Central Processing Unit |
中央处理器 |
第一篇、第二篇 |
| CSV |
Comma-Separated Values |
逗号分隔文本格式 |
第一篇 |
| ETL |
Extract, Transform, Load |
抽取、转换、加载 |
第一篇、第八篇 |
| GPU |
Graphics Processing Unit |
图形处理器 |
第一篇、第三篇、第十篇、第十一篇 |
| GUID |
Globally Unique Identifier |
全局唯一标识符 |
第二篇 |
| HDFS |
Hadoop Distributed File System |
Hadoop 分布式文件系统 |
第一篇、第十篇 |
| H100 |
NVIDIA H100 GPU |
英伟达 H100 加速卡 |
第一篇 |
| JSON |
JavaScript Object Notation |
结构化数据交换格式 |
第一篇、第三篇、第四篇、第十篇、第十一篇 |
| JSONL |
JSON Lines |
按行存储 JSON 的文本格式 |
第一篇、第三篇、第四篇、第十篇 |
| KPI |
Key Performance Indicator |
关键绩效指标 |
第四篇、第八篇 |
| LLM |
Large Language Model |
大语言模型 |
全书 |
| MLOps |
Machine Learning Operations |
机器学习工程运维体系 |
第一篇、第八篇 |
| PDF |
Portable Document Format |
便携式文档格式 |
第一篇、第三篇、第七篇、第十篇、第十一篇 |
| PII |
Personally Identifiable Information |
个人身份识别信息 |
第二篇、第九篇、第十篇 |
| ROI |
Return on Investment |
投资回报率 |
第一篇、第八篇 |
| SLA |
Service Level Agreement |
服务级别协议 |
第一篇、第四篇、第八篇 |
| SOPs |
Standard Operating Procedures |
标准操作规程 |
第四篇、第八篇 |
| SQL |
Structured Query Language |
结构化查询语言 |
第一篇、第四篇、第十一篇 |
| TPU |
Tensor Processing Unit |
张量处理器 |
第一篇 |
| UTF-8 |
8-bit Unicode Transformation Format |
8 位 Unicode 转换格式 |
第二篇 |
数据工程与平台
| 缩写 |
英文全称 |
中文说明 |
主要出现篇章 |
| DataOps |
Data Operations |
数据运营与数据工程运维体系 |
第二篇、第八篇、第十篇 |
| DOM |
Document Object Model |
文档对象模型 |
第三篇、第十一篇 |
| DVC |
Data Version Control |
数据版本控制工具 / 方法 |
第一篇、第二篇、第八篇 |
| FAISS |
Facebook AI Similarity Search |
向量相似度检索库 |
第七篇 |
| FastText |
FastText |
轻量文本表示与分类工具 |
第二篇 |
| LakeFS |
LakeFS |
面向数据湖的版本管理系统 |
第一篇、第八篇 |
| MATTR |
Moving-Average Type-Token Ratio |
移动平均词型-词次比指标 |
第二篇 |
| MFU |
Model FLOPs Utilization |
模型浮点运算利用率 |
第二篇 |
| MinHash |
Min-wise Independent Permutations Hashing |
最小哈希近似去重方法 |
第一篇、第二篇、第十一篇 |
| OOM |
Out Of Memory |
内存溢出 |
第一篇、第二篇 |
| PPL |
Perplexity |
困惑度指标 |
第一篇、第二篇、第四篇 |
| RDMA |
Remote Direct Memory Access |
远程直接内存访问 |
第一篇 |
| ReDoS |
Regular Expression Denial of Service |
正则拒绝服务风险 |
第二篇 |
| TTR |
Type-Token Ratio |
词型-词次比,多样性指标 |
第二篇 |
| WARC |
Web ARChive |
网页归档格式 |
第二篇 |
| WebDataset |
WebDataset |
面向大规模训练的数据打包格式 / 工具 |
第二篇、第三篇 |
训练、对齐与推理
| 缩写 |
英文全称 |
中文说明 |
主要出现篇章 |
| CoT |
Chain-of-Thought |
思维链 |
第六篇、第十篇、第十一篇 |
| DPO |
Direct Preference Optimization |
直接偏好优化 |
第四篇、第十一篇 |
| LoRA |
Low-Rank Adaptation |
低秩适配微调方法 |
第十一篇 |
| PPO |
Proximal Policy Optimization |
近端策略优化 |
第四篇、第十一篇 |
| PRM |
Process Reward Model |
过程奖励模型 |
第四篇、第六篇、第十篇、第十一篇 |
| QA |
Quality Assurance |
质量保障 |
第四篇、第十篇 |
| RAG |
Retrieval-Augmented Generation |
检索增强生成 |
第七篇、第十篇 |
| RL |
Reinforcement Learning |
强化学习 |
第四篇、第十一篇 |
| RLAIF |
Reinforcement Learning from AI Feedback |
基于 AI 反馈的强化学习 |
第四篇 |
| RLHF |
Reinforcement Learning from Human Feedback |
基于人类反馈的强化学习 |
第四篇、第十一篇 |
| RM |
Reward Model |
奖励模型 |
第四篇 |
| ROUGE-L |
Recall-Oriented Understudy for Gisting Evaluation - Longest Common Subsequence |
基于最长公共子序列的文本相似度指标 |
第二篇、第四篇 |
| SFT |
Supervised Fine-Tuning |
监督微调 |
第四篇、第十篇、第十一篇 |
多模态与视觉
| 缩写 |
英文全称 |
中文说明 |
主要出现篇章 |
| BBox |
Bounding Box |
边界框 |
第三篇、第十篇、第十一篇 |
| ChartQA |
Chart Question Answering |
图表问答任务 / 数据集 |
第三篇、第十一篇 |
| CLIP |
Contrastive Language-Image Pre-training |
对比式图文预训练模型 |
第三篇、第十一篇 |
| CLIP-Score |
CLIP Score |
基于 CLIP 的图文相关性评分 |
第十一篇 |
| COCO |
Common Objects in Context |
通用目标检测与图像描述数据集 |
第三篇、第十篇 |
| DINO |
DEtection TRansformer with Improved deNoising anchOr boxes |
一类检测模型名称,常见于 Grounding DINO |
第三篇、第十一篇 |
| DocVQA |
Document Visual Question Answering |
文档视觉问答任务 / 数据集 |
第十一篇 |
| Grounding |
Visual Grounding |
视觉定位 / 对齐任务 |
第三篇、第十篇、第十一篇 |
| IoU |
Intersection over Union |
目标检测重叠度指标 |
第三篇 |
| LLaVA |
Large Language and Vision Assistant |
多模态大模型 / 数据格式名 |
第十篇、第十一篇 |
| OCR |
Optical Character Recognition |
光学字符识别 |
第三篇、第七篇、第十篇、第十一篇 |
| OCR-Rich |
OCR-Rich Data |
富含文字识别信息的图像 / 文档数据 |
第十一篇 |
| SSIM |
Structural Similarity Index Measure |
结构相似性指标 |
第十一篇 |
| ViT |
Vision Transformer |
视觉 Transformer 编码器 |
第十一篇 |
| VLM |
Vision-Language Model |
视觉语言模型 |
第三篇、第十一篇 |
| VQA |
Visual Question Answering |
视觉问答 |
第三篇、第十一篇 |
| XML |
eXtensible Markup Language |
可扩展标记语言 |
第一篇、第三篇 |
| YOLO |
You Only Look Once |
目标检测模型系列 |
第三篇 |
评测、合规与治理
| 缩写 |
英文全称 |
中文说明 |
主要出现篇章 |
| AGI-Eval |
AGI Evaluation |
面向通用智能能力的评测基准 |
第十一篇 |
| DPIA |
Data Protection Impact Assessment |
数据保护影响评估 |
第九篇 |
| GSM8K |
Grade School Math 8K |
小学数学推理评测集 |
第一篇、第十一篇 |
| MCTS |
Monte Carlo Tree Search |
蒙特卡洛树搜索 |
第十一篇 |
| MMLU |
Massive Multitask Language Understanding |
大规模多任务语言理解评测集 |
第一篇、第十一篇 |
| MMMU |
Massive Multi-discipline Multimodal Understanding and Reasoning |
多学科多模态理解与推理评测集 |
第十一篇 |
| NSFW |
Not Safe For Work |
不适宜公开场景内容 |
第二篇 |
| P99 |
99th Percentile |
第 99 百分位指标 |
第二篇 |
| P99.9 |
99.9th Percentile |
第 99.9 百分位指标 |
第二篇 |
| RoPA |
Record of Processing Activities |
处理活动记录 |
第九篇 |