整条消息AI通信被视为更有用|全球实时

随着GPT-4等大型语言模型(LLM)的进一步发展，它们自然会更好地利用可用信息来生成几乎任何主题的有用文本——不仅是短语或句子，而且是整个文档。

【资料图】

根据康奈尔大学的一项新研究，在个人通信至关重要且几乎不可能的领域——代议制政府——使用AI编写完整消息似乎比使用AI生成单个句子更有效。

由艺术与科学学院(A&S)政府系JohnL.Wetherill教授兼康奈尔大学JebE.Brooks公共政策学院康奈尔技术政策研究所所长SarahKreps领导的研究小组进行了测试一个AI介导的通信程序，用于查看消息级建议文本是否比句子级建议更有用。

克雷普斯和她的团队发现，扮演国会工作人员角色的研究参与者在收到消息级建议时比收到单个句子建议的人反应更快，对体验更满意。

“这几乎是一种成本效益效用计算，”克雷普斯说，并指出民选官员每周可以收到数千封电子邮件，有时甚至每天。“一旦你使用了这个工具，如果消息级别的建议足够好(看起来确实如此)，那么使用消息级别而不是句子级别是有意义的，因为句子级别需要更多的人机交互。”

Kreps的论文“ComparingSentence-LevelSuggestionstoMessage-LevelSuggestionsinAI-MediatedCommunication”发表在2023年CHI计算系统人为因素会议论文集(CHI"23)上。第一作者是傅立业博士。"22，信息技术集团汤森路透的应用研究科学家。该论文的一个版本当前可在arXiv预印本服务器上获得。

合著者BenjaminNewman(西雅图艾伦人工智能研究所研究员)和MauriceJakesch博士。"22，将在计划于4月23日至28日在德国汉堡举行的CHI"23上展示该论文。

克雷普斯也是一名法学兼职教授，她说她在之前研究立法者是否容易受到人工智能生成的信息影响的研究中产生了这项工作的想法。一位国会议员告诉她，用不了多久“我们就会使用AI来响应AI编写的消息，”Kreps说。“他说，‘那真是太好了，因为我们收到了很多电子邮件，其中很多都是重复的，所以这些工具可能真的很有价值。’”

克雷普斯说，立法者已经将“99.999%”的电子邮件通信外包给工作人员，所以也许人工智能可以处理这项工作。“无论如何，员工基本上只是在进行剪切和粘贴，”她说。“所以这些人工智能工具实际上与员工现在所做的并没有明显的不同。”

为了这项工作，Fu和康奈尔鲍尔斯计算与信息科学学院的一群计算机科学本科生开发了Dispatch，这是一个可以模拟员工回复选民电子邮件过程的应用程序。Kreps招募了120名参与者作为立法人员，并将他们置于三种实验条件之一：40名参与者没有得到AI生成的帮助;40条收到句子级别的建议;40条收到消息级别的建议，两种类型的建议均由GPT-3生成。

研究人员通过Resistbot对立法者收到的信件进行了抽样，该服务宣传能够在不到两分钟的时间内撰写和发送信件给立法者。研究人员只使用了信件的内容，没有姓名，并选择了由多人发送的信件，这样就无法识别单个发件人。

不使用AI帮助的“员工”需要将近16.5分钟来完成每封信件，几乎是使用消息级AI建议的员工的两倍。由于需要编辑和消息制作，那些使用句子级建议的人只用了不到16分钟;实际写作时间约为12分钟。

不使用人工智能帮助的“员工”需要的时间几乎是那些使用消息级人工智能建议的员工的两倍。此外，那些使用消息级回复建议的人普遍认为该系统易于使用，他们收到的建议自然而有用。然而，使用句子级建议的参与者并未对建议的自然性和实用性给予好评。

“这种关系应该具有高度的同理心和理解力，”克雷普斯谈到立法者与选区的动态时说。“公民想要被倾听。然而，这种本能的问题在于，我们距离政客们敲门、进行个人对话和炉边聊天的世界有多远。这种关系中的大部分已经自动化了。

关键词：