1. 磐创AI-开放猫官方网站首页
  2. 机器学习
  3. TensorFlowNews

DrQA基于维基百科数据的开放域问答机器人实战教程

DrQA基于维基百科数据的开放域问答机器人实战教程

作者 | fendouai

编辑 | 磐石

【磐创AI导读】:本文主要向大家推荐一个开放域问答机器人的实战项目。欢迎大家点击上方蓝字关注我们的公众号:磐创AI


目录:

  • 官方介绍

  • 实战


DrQA 是一个基于维基百科数据的开放域问答系统,它由检索器和阅读器组成。其中检索器用于从海量的文本(例如维基百科)中获得相关的文章;阅读器用于从文章中获得相应的答案。

 

一 . 官方介绍

DrQA是一个应用于开放域问答的阅读理解系统。特别是,DrQA的目标是“大规模机读”(MRS)。在这个设定中,我们在可能非常大的非结构化文档集中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)的挑战与机器对文本的理解(从这些文档中识别答案)的挑战相结合。

 

我们使用DrQA的实验侧重于回答factoid问题,同时使用Wikipedia作为文档的独特知识源。维基百科是一个非常适合大规模,丰富,详细信息的来源。为了回答任何问题,必须首先在超过500万个文章中检索可能相关的文章,然后仔细扫描它们以确定答案。

 

请注意:

DrQA将Wikipedia视为一个通用的文章集合,并不依赖于其内部知识结构。因此,DrQA可以直接应用于任何文档集合。

 

数据集:维基百科

框架:PyTorch

版本:PyTorch torch-0.3.0

论文:Reading Wikipedia to Answer Open-Domain Questions

项目:https://github.com/facebookresearch/DrQA

系统架构:

DrQA基于维基百科数据的开放域问答机器人实战教程

二. 实战


交互模式下提问(一):

where is stanford university

DrQA基于维基百科数据的开放域问答机器人实战教程

可以看到检索到的文档是 Stanford University,问题的答案是:浅绿色标注的部分,答案非常的精准。

 

交互模式下提问(二):

where is Barack Hussein Obama from

DrQA基于维基百科数据的开放域问答机器人实战教程

回答不是很精准,我其实想问的是奥巴马来自哪里。答案返回的是奥巴马在哪里,奥巴马在华盛顿,不过也还是相当不错。

 

交互模式下提问(三):

who is Donald Trump

DrQA基于维基百科数据的开放域问答机器人实战教程

这个问题并没有找到准确的答案,虽然文档是相关的。


你也许还想


● 一文彻底搞懂BP算法:原理推导+数据演示+项目实战(上篇)

● TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程(文末有惊喜)

● 入门 | Tensorflow实战讲解神经网络搭建详细过程



Tips:欢迎大家点击最下方二维码关注我们的公众号,点击干货资源专栏发送关键字“资源”获取更多资源推荐。关注历史文章,一起畅游在深度学习的世界中。期待你的留言和投稿,共建交流平台。来稿请寄:voice1235@163.com

欢迎扫码关注:

DrQA基于维基百科数据的开放域问答机器人实战教程


DrQA基于维基百科数据的开放域问答机器人实战教程 点击下方 |  | 了解更多

磐创AI:http://www.panchuangai.com/ 智能客服:http://www.panchuangai.com/ TensorFlow:http://panchuang.net 推荐关注公众号:磐创AI

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2018/07/26/4844871e2e/

发表评论

登录后才能评论

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息