paint-brush
战争如何导致人工智能打击假新闻经过@danielkor
532 讀數
532 讀數

战争如何导致人工智能打击假新闻

经过 Daniel Korogodski 2022/07/04
Read on Terminal Reader
Read this story w/o Javascript

太長; 讀書

Fake Vision 是一种工具,允许讲英语的用户评估与乌克兰事件相关的新闻,形成对事件的客观看法,并从总体上解决宣传问题。它使用神经网络分析 YouTube 上的视频、音频和文本内容,并结合音频/文本内容的语义分析。该工具允许用户根据真相和谎言分析文本信息。将最终分数分配为从 0 到 100% 的百分比,其中 0 为假,100% 为真。

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - 战争如何导致人工智能打击假新闻
Daniel Korogodski  HackerNoon profile picture

战争是人类最糟糕的发明,它毁掉了几代人的生命并留下无法治愈的伤口。过去千年的战争在宣战的方式上至少有一些诚实,谁反对谁是很清楚的。然而,现代战争是不同的。信息战是乌克兰和俄罗斯之间正在进行的战争的很大一部分,其中有很多操纵舆论的假新闻。俄罗斯政府已经部署了针对西方观众的整个电视频道网络,现在他们正大量利用它们来改变世界对乌克兰的看法,对乌克兰做出虚假声明,并说服俄罗斯不是在杀人,而是在“拯救他们”。 "

为什么这对我很重要?

战争对我个人产生了影响。我是联合创始人第一桥- 乌克兰的一家 IT 研发公司,拥有 100 多名乌克兰工人。战争给我们的国家带来了死亡和大规模破坏,但作为一个社会或一个公司,我们并没有放弃。我们继续努力支持我们的团队和国家。


随着战争在前线展开,我们目睹了俄罗斯的宣传如何影响后苏联国家,许多乌克兰和其他记者开始在这些国家与俄罗斯的假货作斗争。然而,我们经常忘记我们很少看到的宣传——西方英语世界的俄罗斯宣传,这非常重要,因为它涵盖了更多影响西方国家政治决策的人。那时我们决定我们必须做一些事情来帮助打击假新闻。

我们如何决定使用人工智能来打击假货

我们的合作伙伴 BrandVision 的内部开发项目之一是具有适当技术的最佳候选者,该技术可以整合到打击假新闻的新工具中。这是一个帮助品牌有效接收目标受众反馈并与之互动的项目。它使用神经网络分析 YouTube 上的视频、音频和文本内容,并结合音频/文本内容的语义分析。这是 MVP 中途的早期创业公司。


我们想找到一种方法来快速创建适合市场需求的产品。同时,我们了解到,在一场信息战中,分析技术发挥了重要作用。看到在打击面向西方的英语信息资源的活动中存在差距,我们选择了我们的技术要素之一来解决这个问题。

完美的支点

就在那时,我们做出了一个转折点,将 Brand Vision 转变为 Fake Vision - 一种在线工具,通过使用可训练的神经网络检查新闻客观性来对抗西方英语媒体中的军事宣传。这使我们能够在 2 个月而不是 6 个月内构建出实际产品,并让我们有机会帮助我们的国家。而且,作为奖励,由于这种情况,有可能加速用户获取,这有助于我们并帮助国家。


通过使用作为 BrandVision 项目基础的各种神经网络,可以实现与音频、文本和视频内容交互以及情绪反应的能力。这种全面的专业知识是 Fake Vision 项目的基础,该项目是由于入侵乌克兰而形成的一项非营利性倡议。该项目的主要目标是形成一个简单的工具,使讲英语的用户能够评估与乌克兰事件相关的新闻,形成对事件的客观看法,并从总体上解决宣传问题。

假视力

Fake Vision 是一款允许用户根据真假分析文本信息的产品。将最终分数分配为从 0 到 100% 的百分比,其中 0 为假,100% 为真。新闻网站可以作为信息来源,为此建立了一种单独的数据收集方法,以进一步进行神经分析。

Fake Vision - 检查有关乌克兰和俄罗斯之间战争的新闻的可信度

一篇新闻文章的分析由两部分组成:标题和正文。单独的神经网络分析标题,文章的主要部分被分割成段落进行更准确的评估,以便用户可以看到内容的哪一部分是操纵性的。今天的 Fake Vision 功能基于逐篇分析,这意味着可以根据用户请求分析一篇文章。在项目的框架内,建立了神经网络持续训练的机制,让用户可以评估新闻的客观性,我们在每一轮人工智能训练中都考虑到这一点。

Fake Vision - 查看已检查的文章及其可信度分数

作为假视觉的主要分类器,选择了双向长短期记忆(bi-LSTM)类型的循环神经网络。这些神经网络旨在构建文本分类器。 LSTM 网络的大致轮廓如图 1 所示。

图 1 - LSTM 网络的大致轮廓

分类过程中的一个关键步骤是训练分类器。分类器在由矩阵及其标签组成的数据库上进行训练。标签包含有关此矩阵是属于假数据还是真实数据的信息。标签是从数据库中加载的,并且数据库中的所有文章都已经标记了它们是否为真。分类器是根据监督学习方法训练的,这意味着存在一套完整的标记数据,用于在模型构建的所有阶段训练模型。


该图显示了训练神经网络的一般原理。文章被馈送到神经网络,计算神经网络的输出y并与最初给定的“真相”-z进行比较,由此计算网络误差,调整网络本身的参数根据这个误差(见图2),以权重系数的形式。

图 2 - 给定加权参数的神经网络输出的计算原理

在神经网络的输出端,数据按照 sigmoidal 激活函数进行分类,其形式如图 3 所示。

图 3 - 信息如何分类的图示

当前阶段

目前,Fake Vision 的神经网络正在校准过程中(训练到像所罗门王一样聪明),团队需要社区的支持才能更快地训练。您也可以通过访问 __ Fake Vision 网站__ 并添加他们感兴趣的新闻文章的链接来成为打假英雄 - 之后,神经网络将检查可信度并给出可信度分数。然后,用户可以同意或不同意 Fake Vision 对每个段落的可信度等级,并帮助改进算法。

Fake Vision - 参与改进算法以提高其准确性

结论

在神经网络训练到足以达到近乎完美的准确性后,该团队计划扩展 Fake Vision 以能够检查任何新闻的可信度。人工智能不会解决所有世界问题,但好的新闻业与能够识别虚假信息的人工智能相结合,肯定会帮助乌克兰赢得战争并使乌克兰变得更美好。


从公司的角度来看,战争会带来挑战,我们认为其中一些是可以解决的。这是我们成为最好的自己并帮助我们自己、我们的国家和我们的公司的机会。