贡献者¶

於俊

於俊，中国科学技术大学自动化系副教授/博导、博士、华为最具价值教师(MVI)、华为/昇思开发者双认证布道师。研究方向为多媒体计算与智能机器人。主持科研项目40项，包括国家自然科学基金5项、国家航空科学基金1项、中国人工智能学会-华为学术基金3项、华为旗舰研究计划3项，主导形成系列模型套件并已进入华为计算产品线；发表学术论著200余篇，主要包括一作/通讯IEEE(ACM) TOP汇刊/CCF-A类国际顶会/SCI一区期刊论文100余篇；第1完成人荣获中国智能技术最高奖-吴文俊科学技术奖、国际顶会(CVPR_PBVS/ICCV_MFR/ICME/FG)较优论文奖6项、国际顶会AI挑战赛(CVPR/ICCV/IJCAI/AAAI/MM/ECCV等)冠军100余项、安徽省人工智能科技进步一等奖、中国人工智能学会-华为昇思MindSpore学术奖励基金结题优秀奖励(2项)、网易“卓越教师”奖、华为昇思MindSpore“卓越指导教师”奖、教育部-华为“智能基座”栋梁之师奖、中国科学院王宽诚育才奖、中国科学技术大学兴业证券教育奖；第2完成人荣获安徽省自然科学二等奖、安徽省教学成果一等奖(5项)、安徽省教学成果二等奖(1项)、中国高等教育学会“校企合作双百计划”提名奖；第1发明人授权专利20余项；长期担任多个国际顶会(IJCAI/AAAI/CVPR/ICCV/ICML/NeurIPS/MM/ICLR等)SPC Member、华为昇思MindSpore技术委员会委员；作为唯一指导教师荣获世界机器人大赛冠军(2项)、“挑战杯”科技竞赛-揭榜挂帅专项赛-国赛一等奖(2项)、华为昇腾AI创新大赛银奖、华为昇思MindSpore杰出开发者(2名)；主讲本科生基础课《数据结构及其算法》、《模式识别导论》、《人工智能导论》、《数字逻辑电路》，以及研究生基础课《计算机视觉》，年均350学时，其中4门AI核心课程入选华为智能基座计划；主持《计算机视觉与模式识别》等教育部-华为产学合作协同育人/省质量工程项目9项；主编《计算机视觉与模式识别》、《嵌入式高效视觉感知：从理论到实践》、《Multi-modal Human Modeling, Analysis and Synthesis》等8部教材，其中1部获华为ICT优秀教材奖；主持研发华为昇思MindSpore人脸套件(MindFace)并已上线(https://github.com/mindspore-lab/mindface)，核心参与华为昇思MindSpore光学字符识别套件(MindOCR)并已上线(https://github.com/mindspore-lab/mindocr)。

陈长汶

陈长汶是香港理工大学计算机与数学科学学院视觉计算讲座教授及署理院长。他曾任香港中文大学（深圳）理工学院院长、鹏城实验室副主任，并曾担任 IEEE Transactions on Multimedia 和 IEEE Transactions on Circuits and Systems for Video Technology 主编。Chen 教授曾获得 Alexander von Humboldt Award、SUNY Chancellor's Award for Excellence in Scholarship 和 UIUC ECE Distinguished Alumni Award，是 IEEE Fellow、SPIE Fellow 和 Academia Europaea 成员。凭借在视觉计算与多媒体系统领域的长期研究积累，Chen 教授为本书讨论的数据工程挑战提供了权威视角。

于璠

于璠现任 AI 计算框架 MindSpore 高级架构师，曾获 2020 OSCAR 开源人物，并受聘为哈尔滨工业大学客座教授。他主导或参与了 AI 系统核心算法、云计算资源调度、SDN 大规模路由架构与算法的设计和实现，发表论文和专利 30 余项。于璠毕业于中国科学技术大学计算机科学专业。

王聪

王聪毕业于中国科学技术大学计算机科学与技术学院，获硕士学位。其研究兴趣包括多模态大模型训练与推理、AI 数据工程以及 Agentic AI 技术的研究与工程落地。

骆阳

骆阳毕业于浙江大学信息与电子工程学院，获硕士学位。研究兴趣方向包括深度学习框架、AI 数据处理、数据合成、大语言模型后训练与数据智能体。曾参与 MindSpore 框架优化、LLM 后训练数据准备、数据分析与数据查询智能体研究与开发工作，熟悉大规模数据处理系统、数据智能体应用落地。

张然

张然目前正在中国科学技术大学攻读控制科学与工程硕士学位。其研究兴趣包括多媒体计算和深度学习。

杜文卓

杜文卓目前正在中国科学技术大学攻读控制科学与工程硕士学位。其研究兴趣包括多媒体计算和深度学习。

徐鑫

徐鑫目前正在中国科学技术大学攻读电子信息硕士学位。其研究兴趣包括多媒体计算和深度学习。

王柯

王柯目前正在中国科学技术大学先进技术研究院攻读硕士学位，地点为中国合肥。其研究兴趣包括 AI 基础设施、多模态大语言模型和 AI 智能体。

汪志立

汪志立目前正在中国科学技术大学攻读计算机技术硕士学位。其研究兴趣包括多模态大模型和智能体。

刘中一

刘中一毕业于美国伊利诺伊大学厄巴纳-香槟分校。研究兴趣方向包括大语言模型、智能体后训练、强化学习、工具使用、多模态数据合成与数据智能体。曾参与预训练数据准备、多模态数据合成、智能问数 Agent 训练等工作，熟悉从数据构建、训练优化到智能体应用落地的完整流程。

曹旭宏

曹旭宏毕业于西北大学。工作与研究方向包括高性能分布式通信框架、分布式计算引擎、AP 数据库内核、大语言模型与数据智能体。曾参与微服务高性能通信、存算分离 AP 数据库系统内核开发、异构计算引擎与数据智能体系统建设，熟悉从底层系统架构设计、核心引擎开发、性能优化到 LLM 驱动的数据智能体应用落地的完整流程。

穆冠霖

穆冠霖目前正在中国科学技术大学攻读计算机技术硕士学位。其研究兴趣包括多模态生成和系统优化。

Guanjun Liu

刘冠君目前是中国科学技术大学自动化系研究生。其研究兴趣包括光学字符识别（OCR）、文档智能、多模态大语言模型和表格理解，目前主要从事 OCR 建模和文档解析相关研究。

Yuefeng Zou

Yuefeng Zou 目前正在中国科学技术大学攻读计算机技术硕士学位。其研究兴趣包括视觉语言模型和深度学习。

Lin Xu

Lin Xu 目前正在中国科学技术大学自动化系攻读硕士学位，并隶属于中国科学技术大学-云知声多媒体智能联合实验室。其研究兴趣包括医学人工智能、多模态大语言模型、医学视觉语言学习和放射影像理解。其当前研究重点是增强医学多模态模型面向临床应用的视觉感知能力和跨模态推理能力。

Xinyu Chen

Xinyu Chen 2023 年获得中国科学技术大学工学学士学位，目前在中国科学技术大学信息科学技术学院攻读博士学位。其研究兴趣包括神经架构搜索、多模态大模型和强化学习。

Fengxin Chen

Fengxin Chen 目前正在中国科学技术大学自动化系攻读工程博士学位。他曾获得东北林业大学工学学士学位和合肥工业大学硕士学位。其研究兴趣包括语音大语言模型、数据工程和图像增强。

Xuan Li

Xuan Li 曾获得郑州大学工学学士学位，目前正在中国科学技术大学攻读工程博士学位。其研究兴趣主要包括多模态模型的感知和潜在推理。

Gongpeng Zhao

Gongpeng Zhao，Alibaba Group，中国。

王灿

王灿毕业于浙江大学，获工商管理硕士学位。他在阿里巴巴工作多年，是跨境电商领域专家。其当前工作与研究方向主要聚焦于智能体（Agent）技术及其在企业与电商场景中的应用。

Feng Zhao

Feng Zhao，Xi'an University of Posts and Telecommunications，西安，中国。

Ye Yu

Ye Yu，Hefei University of Technology，合肥，中国。

Fang Gao

Fang Gao，Guangxi University，南宁，中国。

Jiaen Liang

Jiaen Liang，Unisound AI Technology Co., Ltd.，中国。

Wei Huang

Wei Huang，Unisound AI Technology Co., Ltd.，中国。

Shengping Liu

Shengping Liu，Unisound AI Technology Co., Ltd.，中国。

Qingsong Liu

Qingsong Liu，Unisound AI Technology Co., Ltd.，中国。

Jianqing Sun

Jianqing Sun，Unisound AI Technology Co., Ltd.，中国。