[疑问] GPT API 真假鉴别的一个思路

moe

4 月前

最近在研究GPT的api，我的想法是：给一些随机的测试输入，直接设置logprobs=True， top_logprobs=20，查看第一个输出token前20的概率与官方的是否一致（或者检查共同输出的前缀所对应的概率）。有官方API作为真值，这应该错不了。

看到有大佬已经做了一些工作（https://linux.do/t/topic/199694），没有那个论坛的账号，只能在这里发一下了。主要是验证思路大概有：
1. 设置较低温度参数，正版api应多次回复结果相似。
2. 使用GPT特色的函数调用接口。
3. 看返回的模型名称和系统指纹（应该api里的system_fingerprint和model）参数。

我觉得这多少都有一些问题：
1. 评价“结果相似”过于主观。商家可能可以针对性优化？
2. 这个函数调用接口，不知道能不能通过分流之类的造假，也不能避免以次充好。
3. 这个模型的名称能不能商家自己修改？我感觉不够稳健。