X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到桂林科技成果交易平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[00296719]多模态反腐案例特征发现与腐败案件发展态势预判

交易价格: 面议

所属行业: 网络

类型: 非专利

技术成熟度: 正在研发

交易方式: 技术转让 技术转让 技术入股

联系人: 南方科技大学

进入空间

所在地:广东深圳市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

技术特点 主要研究基于海量多模态反腐案例的多维度特征学习的关键技术和方法,构建可用于腐败案件预测及模拟推演的案件态势发展演化模型。从现有纪检机关历史案例信息深度处理出发,针对不同腐败案件类型,采用序列模式挖掘技术,提取结构化数据的低位特征和非结构化数据转化为结构化数据后特征的序列模式,给予特定犯罪行为定性为和时间序列构成的假设,针对不同腐败案件类别分别进行特征序列模式挖掘,并构建可变维度犯罪嫌疑行为序列特征库。研究具备时序特性的职务犯罪社会关系网络。举报线索网络的拓扑演化规律,分析不同粒度层次上犯罪线索链。社会关系链及犯罪证据链之间的拓扑结构与相互作用机制,实现融和线索链、社会关系链及犯罪证据链的暗恋“推理网络”,并采用给予群体智能的网络路径规划算法,实现在推理网络和线索网络上快速寻径,进行要案的时空推演,实现对案件进行模拟推演和态势预判。 技术先进性 整个研究内容可以大致分为四个阶段,即数据获取、信息抽取算法的研究、数据库的设计、可视化系统的设计与实现。最终实现整个过程的自动化进行,通过定期对于数据源的数据抓取,并通过相关的信息抽取算法进行信息抽取,将非结构化的文本数据转为结构化,同时对于获取的信息自动存入数据库当中并通过web端以可视化的形式显示数据的分析结果。系统框图如图一。 图一 系统框图 实施方案: 在数据的获取阶段,将通过前期的调研工作,确定数据来源之后,对于相关网站进行网站的逻辑分析,结合当前主要的爬虫技术,分析数据爬取的可能与难度,实现对数据的自动抓取存储。多数网站同时会有一些反爬虫技术,所以如何突破数据源网站的反爬虫限制等也是研究内容之一。在能够顺利完成下载之后,同时需要考虑下载的效率,将采用多线程等方式完成对于数据的快速获取,另外在实际的应用当中,经常会遇到网络故障等异常,为提高整个系统的稳定性,异常处理也是一个重要内容。 在获取数据之后,如何完成对于非结构化的判决文书文本进行信息抽取转为结构化信息为本系统的主要研究内容之一。首先,通过人工的方式对数据进行预先分析,确定判决书信息抽取结构以及判决书当中的哪些数据可以作为待抽取项的内容,确定信息的抽取方向,同时根据项目的要求,拟将对于以下类别信息进行准确抽取。 文书信息:判决时间、案由、判决法院、原告、被告、法官、审判长、审判员、公诉机关、判决省份; 被告人信息:被告人姓名、上诉人姓名、性别、出生日期、出生地民族、文化程度、辩护人、律师事务所; 犯罪线索链:犯罪时间、行受贿人员、行受贿金额、地点信息、机构信息; 判决信息:法律条文依据、量刑、是否自首等信息。 在确定了信息抽取的目标之后,需要对于信息抽取的相关技术进行调研,基于模式匹配、语义理解和命名实体识别等是当今信息抽取的主要方式,针对不同的数据项进行分词探究以采取最佳的抽取算法。而现有的算法有时不一定能够很好的完成项目的需要,所以针对于已经存在的相关算法进行改进创新也是研究的重要内容之一。 当在能够顺利获得结构化的数据之后,如何对于数据进行有效的存储以供接下来的项目需求也是研究的一个重点,选择MySQL数据库,面对将会产生的多达千万级的数据,如何优化数据表的结构,以及如何提高数据写入和查询的性能和效率也是重要的考虑问题之一。而包括数据库的安全稳定也是构建一个系统必须考虑的问题。 系统的可视化拟选用web端展示,能够实现很好的跨平台效果。基于抽取的信息项,同时基于项目的要求,如何完成多维度的数据展示,直观的提供数据当中存在的规律也是需要考虑的问题,正确的呈现贪污犯罪的特点和内在规律,这也为侦查人员和国家的制度创新提供参考依据。另根据项目的要求,需完成腐败趋势预判等功能,则在信息抽取阶段当中抽取的犯罪信息链有着重要的作用,基于概率图的方法来预测推断下一步的最佳侦查方向,为侦查人员提供辅助。 最后一个阶段,作为一个文本分析可视化系统,需要考虑系统的总体架构,实现信息的获取、信息抽取、信息储存、和信息的可视化展示之间的互通互联,系统架构合理,系统的稳定性、安全性均为需要考虑的重点内容。系统采取模块化的结构方式,整体采取自动化的工作形式,无需人为干预就能够实现数据的自动更新和一系列的后期抽取并同步到web的可视化界面上。 应用市场 目标客户群:国家或省部级市级纪检监察机关。e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片61.png e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片62.pnge:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片63.png e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片64.png

e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片65.png

技术特点 主要研究基于海量多模态反腐案例的多维度特征学习的关键技术和方法,构建可用于腐败案件预测及模拟推演的案件态势发展演化模型。从现有纪检机关历史案例信息深度处理出发,针对不同腐败案件类型,采用序列模式挖掘技术,提取结构化数据的低位特征和非结构化数据转化为结构化数据后特征的序列模式,给予特定犯罪行为定性为和时间序列构成的假设,针对不同腐败案件类别分别进行特征序列模式挖掘,并构建可变维度犯罪嫌疑行为序列特征库。研究具备时序特性的职务犯罪社会关系网络。举报线索网络的拓扑演化规律,分析不同粒度层次上犯罪线索链。社会关系链及犯罪证据链之间的拓扑结构与相互作用机制,实现融和线索链、社会关系链及犯罪证据链的暗恋“推理网络”,并采用给予群体智能的网络路径规划算法,实现在推理网络和线索网络上快速寻径,进行要案的时空推演,实现对案件进行模拟推演和态势预判。 技术先进性 整个研究内容可以大致分为四个阶段,即数据获取、信息抽取算法的研究、数据库的设计、可视化系统的设计与实现。最终实现整个过程的自动化进行,通过定期对于数据源的数据抓取,并通过相关的信息抽取算法进行信息抽取,将非结构化的文本数据转为结构化,同时对于获取的信息自动存入数据库当中并通过web端以可视化的形式显示数据的分析结果。系统框图如图一。 图一 系统框图 实施方案: 在数据的获取阶段,将通过前期的调研工作,确定数据来源之后,对于相关网站进行网站的逻辑分析,结合当前主要的爬虫技术,分析数据爬取的可能与难度,实现对数据的自动抓取存储。多数网站同时会有一些反爬虫技术,所以如何突破数据源网站的反爬虫限制等也是研究内容之一。在能够顺利完成下载之后,同时需要考虑下载的效率,将采用多线程等方式完成对于数据的快速获取,另外在实际的应用当中,经常会遇到网络故障等异常,为提高整个系统的稳定性,异常处理也是一个重要内容。 在获取数据之后,如何完成对于非结构化的判决文书文本进行信息抽取转为结构化信息为本系统的主要研究内容之一。首先,通过人工的方式对数据进行预先分析,确定判决书信息抽取结构以及判决书当中的哪些数据可以作为待抽取项的内容,确定信息的抽取方向,同时根据项目的要求,拟将对于以下类别信息进行准确抽取。 文书信息:判决时间、案由、判决法院、原告、被告、法官、审判长、审判员、公诉机关、判决省份; 被告人信息:被告人姓名、上诉人姓名、性别、出生日期、出生地民族、文化程度、辩护人、律师事务所; 犯罪线索链:犯罪时间、行受贿人员、行受贿金额、地点信息、机构信息; 判决信息:法律条文依据、量刑、是否自首等信息。 在确定了信息抽取的目标之后,需要对于信息抽取的相关技术进行调研,基于模式匹配、语义理解和命名实体识别等是当今信息抽取的主要方式,针对不同的数据项进行分词探究以采取最佳的抽取算法。而现有的算法有时不一定能够很好的完成项目的需要,所以针对于已经存在的相关算法进行改进创新也是研究的重要内容之一。 当在能够顺利获得结构化的数据之后,如何对于数据进行有效的存储以供接下来的项目需求也是研究的一个重点,选择MySQL数据库,面对将会产生的多达千万级的数据,如何优化数据表的结构,以及如何提高数据写入和查询的性能和效率也是重要的考虑问题之一。而包括数据库的安全稳定也是构建一个系统必须考虑的问题。 系统的可视化拟选用web端展示,能够实现很好的跨平台效果。基于抽取的信息项,同时基于项目的要求,如何完成多维度的数据展示,直观的提供数据当中存在的规律也是需要考虑的问题,正确的呈现贪污犯罪的特点和内在规律,这也为侦查人员和国家的制度创新提供参考依据。另根据项目的要求,需完成腐败趋势预判等功能,则在信息抽取阶段当中抽取的犯罪信息链有着重要的作用,基于概率图的方法来预测推断下一步的最佳侦查方向,为侦查人员提供辅助。 最后一个阶段,作为一个文本分析可视化系统,需要考虑系统的总体架构,实现信息的获取、信息抽取、信息储存、和信息的可视化展示之间的互通互联,系统架构合理,系统的稳定性、安全性均为需要考虑的重点内容。系统采取模块化的结构方式,整体采取自动化的工作形式,无需人为干预就能够实现数据的自动更新和一系列的后期抽取并同步到web的可视化界面上。 应用市场 目标客户群:国家或省部级市级纪检监察机关。e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片61.png e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片62.pnge:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片63.png e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片64.png

e:\k8008\qiuchengcai\桌面\成果图片\南科大成果图片\案例\图片65.png

推荐服务:

Copyright © 2017  桂林经济技术开发区管理委员会    桂林经开孵化器管理有限责任公司    All Rights Reserved

桂ICP备17003866号-1

运营商:科易网