导读人类很难解读社交媒体和新闻文章的深层含义和背景。让计算机来做这件事几乎是不可能的任务。即使是精通超过600万种交流形式的C-3PO,也经常
人类很难解读社交媒体和新闻文章的深层含义和背景。让计算机来做这件事几乎是不可能的任务。即使是精通超过600万种交流形式的C-3PO,也经常错过潜台词。
自然语言处理是将计算机与人类语言系起来的人工智能子领域,它使用统计方法来分析语言,通常没有结合理解人类社会变化和潮流所需的真实世界背景。要做到这一点,您必须将在线交流及其产生的上下文转化为计算机可以解析和推理的内容。
普渡大学计算机科学副教授DanGoldwasser和他的团队的其他成员努力通过开发新方法来模拟人类语言并让计算机更好地理解我们来解决这个问题。
“我们工作的动机是更好地理解公共话语、不同问题的讨论方式、提出的论点以及这些论点背后的观点,”戈德瓦瑟说。“我们希望代表成千上万甚至更多人在网上描述他们的经历所表达的观点。了解用于讨论问题的语言可以帮助阐明决策过程背后的不同考虑因素,包括个人健康和福祉的选择以及更广泛的政策决定。”
Goldwasser强调,部分挑战在于,如此多的在线交流依赖于已经了解上下文的读者——无论是Twitter上的速记还是理解模因的基础。为了分析通信,上下文是消息的重要组成部分。
“在我们研究的许多场景中,进展依赖于找到将语言理解概念化的新方法,将其置于现实世界的背景中,”他说。“操作它需要开发新的技术解决方案。”
Goldwasser和他的学生使用从计算机科学、人工智能和计算社会科学的综合智慧中提炼出来的技术。
Goldwasser的实验室研究社交媒体、传统媒体故事和立法文本中使用的语言,以了解演讲者和作家的背景和假设。在文字蓬勃发展的世界里,每个有互网连接的人都可以充当记者,能够以公正的方式研究和分析写作对于人类理解我们自己的社会至关重要。