在准备在 GPU 上运行的应用程序时,了解 GPU 硬件设计的主要特性并了解与 CPU 的相似之处和不同之处会很有帮助。本路线图适用于那些对 GPU 比较陌生或只是想了解更多有关 GPU 中计算机技术的人。不需要特定的并行编程经验,练习基于 CUDA 工具包中包含的标准 NVIDIA 示例程序。
- CUDA Reading Group 相关讲座: GPU Mode Reading Group
- 《CUDA C++ Programming Guide》
- 《CUDA C 编程权威指南》:书中示例代码
- Nvidia 官方 CUDA 是示例
- 《CUDA 编程:基础与实践 by 樊哲勇》
- 《CUDA 编程简介: 基础与实践 by 李瑜》
- 《CUDA 编程入门》 - 本文改编自北京大学超算队 CUDA 教程讲义
- Multi GPU Programming Models
- CUDA Processing Streams
- nvidia-smi 入门
- nvtop 入门
- Nvidia GPU XID 故障码解析
- Nvidia GPU 卡 之 ECC 功能
- 查询 GPU 卡详细参数
- Understanding NVIDIA GPU Performance: Utilization vs. Saturation (2023)
- GPU Utilization is a Misleading Metric
- Andrej Karpathy:Deep Dive into LLMs like ChatGPT(B站视频)
- 大模型基础组件 - Tokenizer
- 深入浅出文本嵌入技术
- 深入探索:AI 驱动的 PDF 布局检测引擎源代码解析
- 上海人工智能实验室开源工具 MinerU 助力复杂 PDF 高效解析提取
- 大模型可视化指南
- unstructured:Open source libraries and APIs to build custom preprocessing pipelines for labeling, training, or production machine learning pipelines.
- MinerU:A high-quality tool for convert PDF to Markdown and JSON.
- markitdown: Python tool for converting files and office documents to Markdown.
- unsloth: About Finetune Llama 3.3, DeepSeek-R1 & Reasoning LLMs 2x faster with 70% less memory!
- ktransformers: A Flexible Framework for Experiencing Cutting-edge LLM Inference Optimizations
- Training a 70B model from scratch: open-source tools, evaluation datasets, and learnings
- Sanitized open-source datasets for natural language and code understanding: how we evaluated our 70B model
- From bare metal to a 70B model: infrastructure set-up and scripts
- Open-sourcing CARBS: how we used our hyperparameter optimizer to scale up to a 70B-parameter language model