提示词工程(一)

发表于2026-03-02|更新于2026-03-02|技术AINLPLLMPrompt Engineering

|浏览量:

吴恩达“提示词工程”课程笔记

0.两种大语言模型(LLM)

Base LLM：基于Next Token Prediction任务进行训练，主要功能是预测文本中的下一个词，训练完成后不再更新，无法学习新知识。此外，Base LLM比起完成任务更像是续写原文，在给定一个提问后，它可能会预测出后续的一系列问句而不是回答问题。
Instruction-tuned LLM：通过给Base LLM输入“问题-答案”序列对，微调原模型，能够更好地理解和执行用户指令，回答问题，执行任务，性能更好。现代的LLM通常是Instruction-tuned LLM，如ChatGPT、Gemini等。

1.清晰具体的指令

1.使用分隔符

使用分隔符（如反引号，大括号，尖括号，或三重引号）来明确分隔提示词的不同部分，这既有利于使提示词更清晰，结构化，也可以有效避免提示词注入问题（如用户输入恶意代码或指令来操纵模型的行为）。例如：请查看下列括号中的文本，总结内容：{text}，并以markdown格式输出。

2.要求结构化的输出

要求模型使用给定格式输出答案，如JSON、HTML、CSV等，这样可以使输出更清晰，易于解析和使用。

3.检查模型输出是否满足条件或假设

先要求模型输出某些特殊信息（如“复述我的要求”，“将任务拆分成多步”），检查后再让模型继续输出。

4.Few-shot提示词（Zero-shot，One-shot同理）

在提示词中提供几个示例输入和输出，帮助模型理解任务的格式和要求，从而提高输出的准确性和相关性。

2.给予模型思考的时间

1.明确任务的各个步骤

2.要求模型给出推导/思考过程而不是直接给出结论

3.避免幻觉

首先要求模型查找相关的引用信息，或者要求模型在回答问题前先列出相关的事实/数据/出处。

3.提示词迭代

不存在通用的“完美提示词”，需要不断地迭代和优化提示词以获得更好的结果。可以先从简单的提示词开始，通过观察模型输出与自己要求的偏差来逐步调整提示词。

4.温度

温度决定了模型输出的随机程度，较高的温度会使输出更具创造性和多样性，而较低的温度则会使输出更确定和一致。根据任务需求调整温度可以获得更合适的输出。一般将模型温度设为0即可。

后记

总的来说，这门课程内容比较少（毕竟只有90min），年代也比较久远了，不过内容清晰直白，是一个不错的提示词工程普及课程，但如果想要深度开发LLM，这门课还是远远不够的。

文章作者: Qz

文章链接: https://www.cosmosh.ink/2026/03/02/%E6%8F%90%E7%A4%BA%E8%AF%8D%E5%B7%A5%E7%A8%8B-%E4%B8%80/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Qz's Blog！

LLM Prompt Engineering

相关推荐

提示词工程(二)

DAIR.AI 提示工程指南个人总结1.模型基本设置 Temperature：决定模型输出是稳定保守，还是随机，有创造性。对于质量保障，数据分析等确定性任务，建议将温度设置为0；对于创意写作等需要多样性的任务，可以适当提高温度。 Top_p：同样衡量模型输出的确定性。使用Top-p意味着只有词元集合（tokens）中具有top_p概率质量的才会被考虑用于响应（0.1 表示只考虑包含在最高 10% 概率质量中的 token），因此较低的top_p值会选择最有信心的响应。这意味着较高的top_p值将使模型考虑更多可能的词语，包括不太可能的词语，从而导致更多样化的输出。一般建议是改变 Temperature 和 Top P 其中一个参数就行，不用两个都调整。 Max length：限制模型输出的最大长度，防止输出过长或过短。 Stop sequence：指定一个或多个停止序列，当模型生成这些序列时，模型将停止生成更多的文本。这对于控制输出的结构和内容非常有用。 Frequency penalty：惩罚模型重复使用相同的词语或短语，通过给重复数量多的 Token...

从Next Token Prediction到智慧涌现

原文链接:https://www.zhihu.com/question/1968361285579150015/answer/1988303137023467994 大模型的本质原理不是概率统计，而是压缩+模拟，或者说，它是在某个临界点从统计跃迁到了智能压缩，而这个临界点即为所谓的“智慧涌现”，或Grokking现象。预测不是目的，而是手段，是模型将客观世界的规律与表征压缩到自己固定大小的参数中的手段对模型的大量预训练以及强化学习手段（RLHF等）实际上都是在进行类似于蒙特卡洛树搜索的操作，基于梯度的参数随机优化方法与庞大的参数量，从模拟的角度看，与蒙特卡洛方法“随机穷举”的思想有异曲同工之妙。提示词工程可以看作是一种“推理时梯度下降”，精心编写的提示词实际上在输入层就在一定程度上实现了特征的解耦与提炼，使模型在一开始就达到了在粗糙的提示词下需要经过前向推理以提取特征才能达到的某种“中间状态” 模型的思考能力（CoT）与逐步的逻辑推理是追求极致优化（降低loss）的必然结果，这一结果的产生是建立在大量的数据支持的基础上的（Scaling...

数据加载中