嘟嘟社区

[疑问] GPT API 真假鉴别的一个思路


最近在研究GPT的api,我的想法是:给一些随机的测试输入,直接设置logprobs=True, top_logprobs=20, 查看第一个输出token前20的概率与官方的是否一致(或者检查共同输出的前缀所对应的概率)。有官方API作为真值,这应该错不了。

看到有大佬已经做了一些工作(https://linux.do/t/topic/199694),没有那个论坛的账号,只能在这里发一下了。主要是验证思路大概有:
1. 设置较低温度参数,正版api应多次回复结果相似。
2. 使用GPT特色的函数调用接口。
3. 看返回的模型名称和系统指纹(应该api里的system_fingerprint和model)参数。

我觉得这多少都有一些问题:
1. 评价“结果相似”过于主观。商家可能可以针对性优化?
2. 这个函数调用接口,不知道能不能通过分流之类的造假,也不能避免以次充好。
3. 这个模型的名称能不能商家自己修改?我感觉不够稳健。