与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千

2020-06-14|浏览量:949|点赞:112
与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千

在不久前,Facebook 发起了 Deepfakes 检测挑战赛;而近日,Google AI 就跟着强势推出 Deepfake 影片检测资料库,势将一同与虚假影片誓不两立。

资料库共含 28 个不同场景下,由真人演员现场拍摄的 3 千多段影片。Google 希望透过这些影片,维护整个社会的网路安全环境,并使开发者利用这些数据,开发新的 Deepfake 检测工具,更有效率辨识 Deepfake 假影片。Google 也在部落格发表文章介绍资料库。与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千

Deepfake 影片检测数据集背景

近几年来,深度学习的发展催生曾认为不可能实现的技术。现代生成模型就是例子之一,能合成超现实主义的图像、语音、音乐甚至影片。这些模型广泛用于各种各样应用,像是透过文本到语音的方式使世界各国的人更容易沟通,或是生成医学成像的训练数据等。

与任何变革性技术一样,这些技术也带来新挑战。所谓「Deepfake」就是其中之一,可由操纵影片和音频剪辑的深度生成模型製作而得。自从 2017 年底首次出现,就有许多开源的 Deepfake 生成方法流入市面,导致合成媒体剪辑影片的数量不断增加。虽然许多人可能只是出于趣味性目的,但一旦落入不法分子手里,就可能对个人和社会造成极大的危害。

Google 认真考虑了这些问题。正如去年的《人工智慧原则》表示:「我们致力于开发 AI 的最佳实践,以减少技术的滥用带来的潜在危害。」

2018 年 1 月,Google 宣布发表合成语音资料库,以支持开发高性能合成音频检测器的国际挑战赛。挑战赛的一部分,是资料库只供给共计超过 150 个研究机构和工业组织下载;从此刻起,资料库免费对大众开放。

Deepfake 影片检测数据集介绍

Google 与 Jigsaw 合作,并发表自製的大型可视化资料库,纳入 Face Forensics 影片基準测试。基準测试是德国慕尼黑工业大学和义大利拿坡里费德里克二世大学开发的图像测试。将这些数据纳入 Face Forensics 影片基準的是由包括 Matthias Niessner 教授、Luisa Verdriva 教授和 Face Forensics 团队在内的主要研究人员合作开发。

为了製作资料库,过去一年,Google 与众多演员合作录製数百段影片;并使用公开的 Deepfake 生成方法,从这些影片创建数千个 Deepfake 假影片。

这些由真实影片和假影片组成的资料库组成可用于 Deepfake 检测和辨识的素材。Face Forensics 基準测试的一部分,资料库现免费提供给研究社群,研究者可用来开发合成影片检测的方法。与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千

演员在各种场景拍摄的影片。上为真实影片,下为 Deepfake 影片,两者之间可能有或微妙或剧烈的变化。

Face Forensics++ 与 Deepfake 检测数据集

Face Forensics++ 是由 1,000 支原始影片序列组成的检测资料库,这些影片序列透过 4 种自动脸部操作方法操作,即 Deepfakes、face 2 face、faceswap 和 Neural Textures。这些数据源于 977 支 YouTube 影片,所有影片都包含一张没有遮挡的正面人像,这使自动篡改法能使伪造更真实。

由于此方法提供二进制遮罩,因此这资料库可用于图像和影片分类及分割。此外,Face Forensics++ 还提供 1,000 个 Deepfakes 模型生成和扩充新数据。有关更多资讯可参考网站。

新版本改进内容Deepfake 数据集的意义

随着 Deepfake 技术不断发展,Google 将添加更多内容到资料库,并继续与合作伙伴合作。支援蓬勃发展的 AI 研究社群,Google 也希望减轻合成媒体滥用的潜在危害,这也正是在 Face Forensics 基準测试加入 Deepfake 资料库的重要意义。

上一篇: 下一篇:

相关推荐