什么是大模型

大语言模型（LLM）是基于深度学习的自然语言处理模型。

核心概念

Transformer - 模型架构基础
预训练 - 在大规模语料上学习
微调 - 针对特定任务优化
推理 - 生成文本输出

主流模型

GPT 系列（OpenAI）
Claude（Anthropic）
Llama（Meta）
通义千问（阿里）