技术详细介绍
在信息技术高速发展的今天,随着数字成像、Internet互联网和数据存储等技术的进步,成千上万的普通用户都可以通过共享图像、视频和其他的在线多媒体进行相互交流和表达,各种信息源上数字图像的数量每天都在持续增长。因此,如何对可视化数据进行快速有效的组织、访问、存储和检索,成为很有价值的研究课题。 由于图像和视频等可视化数据具有数据量大、非结构化和抽象程度低等特点,对其进行自动化处理的难度很大。因此,在图像检索和场景分析等研究领域,图像的语义理解成为一个迫切的问题。图像的自动标注、目标识别和场景分类是实现图像语义理解的重要途径,而图像数据的分类和建模是研究图像语义理解的基本方法,因而图像语义理解是包含了计算机视觉、机器学习和图像处理等多个学科内容的交叉研究领域。 本项目瞄准图像的语义理解和识别这一前沿课题,研究图像语义映射的新理论和新方法,并在图像自动标注、语义检索、场景分类、目标跟踪等任务中进行验证和性能分析。主要研究内容包括:研究图像视觉特征的提取算法及其融合模型;研究图像数据的概率主题建模方法和分类算法;研究图像自动标注和场景分类的模型和方法;研究新的语义描述模型,使其能够有效地支持图像理解应用。 依托本项目发表(录用)学术论文42篇,其中SCI&EI双收录的期刊论文8篇,SCI收录的期刊论文2篇,EI收录的期刊论文9篇,EI收录的国际会议论文10篇。目前获发明专利授权1项,受理1项,获软件著作权1项。项目所取得的研究成果主要体现在以下几个方面: (1)研究图像自动标注和语义理解的方法。提出混合生成式和判别式模型的图像自动标注方法、基于模糊关联规则和决策树的图像自动标注方法,提出新的图像特征点的提取算法和结构相似度编码算法,并提出集成多种查询方式的图像语义检索框架和能有效描述机器知识的逻辑框架。 (2)研究图像的分类和聚类算法。提出基于多示例多标记学习的图像和文本分类算法、基于混合框架和集成特征的图像场景分类方法、集成约束和度量的半监督聚类方法以及基于监督LDA的协同滤波算法。 (3)研究视觉目标跟踪方法。提出一种基于双核的视觉目标跟踪方法、一种结合k-means聚类和可判定稳定区域的鲁棒的目标跟踪方法等几种目标跟踪方法。 (4)研究图像哈希算法。提出基于环形划分和非负矩阵分解的图像哈希算法、结合颜色向量角度和离散小波变换的图像哈希算法、基于环形熵的鲁棒图像哈希算法等。 本项目的主要成果不仅可以成功应用在图像语义映射相关领域,经过适当改进也可以应用于文本分类、数据挖掘、跨媒体检索等多个领域,具有重要的理论意义和应用前景。
在信息技术高速发展的今天,随着数字成像、Internet互联网和数据存储等技术的进步,成千上万的普通用户都可以通过共享图像、视频和其他的在线多媒体进行相互交流和表达,各种信息源上数字图像的数量每天都在持续增长。因此,如何对可视化数据进行快速有效的组织、访问、存储和检索,成为很有价值的研究课题。 由于图像和视频等可视化数据具有数据量大、非结构化和抽象程度低等特点,对其进行自动化处理的难度很大。因此,在图像检索和场景分析等研究领域,图像的语义理解成为一个迫切的问题。图像的自动标注、目标识别和场景分类是实现图像语义理解的重要途径,而图像数据的分类和建模是研究图像语义理解的基本方法,因而图像语义理解是包含了计算机视觉、机器学习和图像处理等多个学科内容的交叉研究领域。 本项目瞄准图像的语义理解和识别这一前沿课题,研究图像语义映射的新理论和新方法,并在图像自动标注、语义检索、场景分类、目标跟踪等任务中进行验证和性能分析。主要研究内容包括:研究图像视觉特征的提取算法及其融合模型;研究图像数据的概率主题建模方法和分类算法;研究图像自动标注和场景分类的模型和方法;研究新的语义描述模型,使其能够有效地支持图像理解应用。 依托本项目发表(录用)学术论文42篇,其中SCI&EI双收录的期刊论文8篇,SCI收录的期刊论文2篇,EI收录的期刊论文9篇,EI收录的国际会议论文10篇。目前获发明专利授权1项,受理1项,获软件著作权1项。项目所取得的研究成果主要体现在以下几个方面: (1)研究图像自动标注和语义理解的方法。提出混合生成式和判别式模型的图像自动标注方法、基于模糊关联规则和决策树的图像自动标注方法,提出新的图像特征点的提取算法和结构相似度编码算法,并提出集成多种查询方式的图像语义检索框架和能有效描述机器知识的逻辑框架。 (2)研究图像的分类和聚类算法。提出基于多示例多标记学习的图像和文本分类算法、基于混合框架和集成特征的图像场景分类方法、集成约束和度量的半监督聚类方法以及基于监督LDA的协同滤波算法。 (3)研究视觉目标跟踪方法。提出一种基于双核的视觉目标跟踪方法、一种结合k-means聚类和可判定稳定区域的鲁棒的目标跟踪方法等几种目标跟踪方法。 (4)研究图像哈希算法。提出基于环形划分和非负矩阵分解的图像哈希算法、结合颜色向量角度和离散小波变换的图像哈希算法、基于环形熵的鲁棒图像哈希算法等。 本项目的主要成果不仅可以成功应用在图像语义映射相关领域,经过适当改进也可以应用于文本分类、数据挖掘、跨媒体检索等多个领域,具有重要的理论意义和应用前景。