大语言模型是通过大量的语言来训练出可以通过用户的提问,来探知用户问题的本意,进而预测最可能的语言答案的模型;

那是否可以通过大量的人类行为数据,来训练出可以根据用户当下的行为,来预测出其将来最可能执行的动作的一种人类模型?

我稍微问了一下Chat GPT是否有这方面的研究或者论文,但是没有得到有用的信息(注1)因此我试着把我目前能想到的思路写下:

首先是训练数据集,我觉得这个模型最重要的功能大概是预防犯罪,因此收集过去普通人的行为,并针对后来发生的犯罪事件进行标注,我觉得可以使得模型产生识别出潜在犯罪的行为模式

这方面的数据当然是越详细越全面越好,但我觉得重要的项目应该包含

  1. 和此人相关的事件的时间地点(比如什么时候去了哪里做了什么/触发或是影响了什么事件)
  2. 网络相关的浏览记录
  3. 财务分配/支出
  4. 任何public的事件的总结(比如某人从来不超速,几乎没有ticket —> 应该不是一个aggressive的人)
  5. social media的整合(比如可以得到一个人的态度/性格/讲话方式)

其次我觉得是模型本身的矩阵或者是维度应该如何定义,这个还需要更专业的知识才能回答

另外prompt injection这种东西需要好好防范,不然会有很大的安全隐患(罪犯隐身/替罪羊)

最终这个模型的使用场景会是什么样子呢?

  1. 向上面所说,以及标题注释,”少数派报告“里面会在犯罪发生之前就预测出来,因此可以提前去预防和修正可能会发生的悲剧;
  2. 测谎之类的(只是一个想法)
  3. 揭示出某人真正的身份或者是意图(因此人类的short memory具有局限性)以及人类的行为侧写比较客观

Trivia