什么是大模型

大语言模型(LLM)是基于深度学习的自然语言处理模型。

核心概念

  • Transformer - 模型架构基础
  • 预训练 - 在大规模语料上学习
  • 微调 - 针对特定任务优化
  • 推理 - 生成文本输出

主流模型

  • GPT 系列(OpenAI)
  • Claude(Anthropic)
  • Llama(Meta)
  • 通义千问(阿里)