大模型常用推理参数工作原理
AI-摘要
小嗷犬 GPT
AI初始化中...
介绍自己 🙈
生成本文简介 👋
推荐相关文章 📖
前往主页 🏠
前往爱发电购买
大模型常用推理参数工作原理
小嗷犬do_sample
do_sample
参数控制是否使用采样方法生成输出。当 do_sample=True
时,模型会根据下一个 token 的概率分布进行采样;当 do_sample=False
时,模型会选择概率最大的 token 作为输出。
temperature
temperature
参数通过影响 softmax
控制生成输出时每个 token 的概率分布的平滑程度。
不考虑 temperature
参数,softmax
概率分布的计算公式为:
加入 temperature
参数后,softmax
概率分布的计算公式为:
下图展示了 temperature
参数的影响:
top_k
top_k
参数控制生成输出时,只考虑概率最高的 top_k
个 token。
下图展示了 top_k
参数的影响:
top_p
top_p
参数与 top_k
参数类似,区别在于 top_p
参数控制生成输出时,只考虑累计概率分布在前 top_p
的 token。
下图展示了 top_p
参数的影响:
协同工作
同时使用 temperature
、top_k
、top_p
参数时,它们的影响会以一定顺序叠加。
下图展示了同时使用 temperature
、top_k
、top_p
参数的影响:
temperature
、top_k
、top_p
参数不会改变各 token 概率的相对大小,因此当 do_sample=False
时,token 的选择不会受到上述三个参数的影响。
评论
隐私政策
✅ 你无需删除空行,直接评论以获取最佳展示效果