【含弘讲坛】文档分析与识别的一些研究进展


来源:   |  文字:
编辑: 刘晓琪   |  审核:

西南大学计信院前沿学术报告
Southwest University IT Faculty Seminar


报告题目:文档分析与识别的一些研究进展
时       间:2019年6月14日(星期五)上午8:30-9:30
地       点:西南大学计算机与信息科学学院1314会议室
报  告  人:刘成林,中国科学院自动化研究所 教授

报告人简介:
        刘成林,中国科学院自动化研究所副所长,模式识别国家重点实验室主任,研究员、博士生导师。1989年、1992年、1995年分别在武汉大学、北京工业大学、中国科学院自动化研究所获学士、硕士和博士学位。1996年至2004年先后在韩国科学技术院、日本东京农工大学、日立中央研究所从事博士后和研发工作。2005年入选中国科学院“百人计划”。2008年获得国家杰出青年科学基金资助。研究兴趣包括图像处理、模式识别、机器学习、文字识别与文档分析等。在国际期刊和国际会议上发表论文200余篇,合著英文专著一本。现任国际刊物Pattern Recognition的副主编和几个刊物的编委、《自动化学报》副主编。中国人工智能学会会士、模式识别专委会主任,中国自动化学会理事、模式识别与机器智能专委会主任。美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。


内容摘要:
        本报告中,介绍中科院自动化所模式识别国家重点实验室在文档图像分析与识别方面的一些最新研究进展,包括手写文档版面分析、场景文本检测、文本行识别、古籍文档分析等方面。在版面分析方面,我们提出了基于条件随机场和全卷积网络(FCN)的方法。在场景文本检测方面,提出了基于深度直接回归的多方向文本检测方法和基于局部区域的任意形状文本行检测与识别方法。在文本行识别方面,我们提出基于深度神经网络过切分的方法和基于滑动字符分类器的方法,适合中文文本行和多语言文本行识别。最后,介绍一个大型中文古籍文字数据库,包含220多万个字符样本,9630类,不同的书写风格,可用于大类别集字符识别、风格自适应、小样本学习、不均衡样本学习、增量学习等研究任务。