万方数据资源系统

长安大学学报(自然科学版)
JOURNAL OF CHANG'AN UNIVERSITY(NATURAL SCIENCE EDITION)
2007 Vol.27 No.1 P.107-110

数字化期刊

电子文献书写错误的快速识别

王剑辉 

摘 要:对欧洲议会的会议纪要文本,采用N重评价法、Garbling模型和编辑-距离法3种方法对文本进行了自动识别,并比较了测试结果.评价结果表明:N重评价法虽然对纠正非词错误不适合,但可以在纠正其他错误中考虑使用;Garbling模型法的纠错结果总的来说是好的,但不适合所有的错误类型;编辑-距离法对纠正非词错误能得到最好的结果.3种方法的合理有效组合,能完善测试结果.
关键词:语言处理;电子文献;书写错误;自动识别
分类号:TP39  文献标识码:A

文章编号:1671-8879(2007)01-0107-04

Fast recognition of write errors in electronic documents

WANG Jian-hui 

作者简介:王剑辉(1965-),男,辽宁沈阳人,沈阳师范大学副教授,马格德堡大学博士研究生,E-mail:jwang116@hotmail.com.
作者单位:王剑辉(沈阳师范大学,科信软件学院,辽宁,沈阳,110034;马格德堡大学,计算机学院,德国,马格德堡,39106) 

参考文献:

[1]Pollock J J,Zamora A.Automatic spelling correction in scientific and scholarly text[J].Communications of the ACM,1984,27(4):358-368.
[2]Heidorn G E,Jensen K.The EPISTLE text-critiquing system[J].IBM Systems Journal,1982,21(3):305-326.
[3]Véronis J.Error in natural language dialogue between man and machine[J].International Journal of ManMachine Studies,1991,35(4):187-217.
[4]Damerau F J.A technique for computer detection and correction of spelling errors[J].Communications of the ACM,1964,7(3):171-176.
[5]Kukich K.Techniques for automatically correcting words in text[J].ACM Computing Surveys,1992,24(4):377-439.
[6]Kashyap R L,Oommen B J.Spelling correction using probabilistic methods[J].Pattern Recognition Letters,1984,2(3):147-154.
[7]Kashyap R L,Oommen B J.An effective algorithm for string correction using a general edit distance-Ⅱ:computational complexity of the algorithm and some applications[J].Information Sciences:An Anternational Journal,1981,23(4):201-217.
[8]Oflazer K.Error-tolerant finite state recognition with applications to morphological analysis and spelling correction[J].Association for Computational Linguistics,1996,22(1):73-89.

收稿日期:2005年11月16日

出版日期:2007年1月30日

请看PDF全文