专利名称:一种基于bottom-up attention和定位信息融合
的图片问答实现方法
专利类型:发明专利
发明人:田文洪,吝博强,高印权申请号:CN201911224396.7申请日:20191204公开号:CN110929013A公开日:20200327
摘要:本发明提供了一种基于Bottom‑up attention和融合定位信息的图片问答系统的实现方法,包括:处理图片和语句数据集;使用Faster‑RCNN获取图片特征作为模型的图片输入,使用经过Glove编码的问题序列,作为模型的问题输入;使用卷积层计算图片的self‑attention结果作为图片特征,使用Bi‑LSTM循环神经网络将问题的编码序列作为输入得到问题的隐藏特征;本发明使用特征融合方法将图片特征,图片中物体的定位信息和问题特征融合为当前任务的特征。在基于图片的问答任务中达到了更高的准确率。解决了因为使用Bottom‑up attention导致丢失物体坐标信息的问题。
申请人:成都中科云集信息技术有限公司
地址:610000 四川省成都市成华区一环路东一段159号信息产业大厦712房
国籍:CN
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务