기록물 디지털화·문자인식 추진 가속화
국가기록원이 지난해에 이어 올해도 기록물 디지털화·문자인식 추진에 나선다.
국가기록원은 ‘21년 기록물 디지털화사업 조달청 공고를 통해 경제정책, 공공차관 등 7천 권 스캐닝(150만면) 및 OCR(20만면) 적용 등 디지털화 사업에 박차를 가할 예정이라고 밝혔다.
국가기록원은 지난해 딥러닝 기반으로 약 22만 개의 한글 타자체 단어를 학습시켜 국내 최초로 비전자 타지기로그이 인공지능(AI) 문자인식(OCR)* 기술 개발에 성공했다.
*사람이 쓰거나 기계로 인쇄한 문자의 이미지를 기계가 읽을 수 있는 문자로 변환하는 기술
-
문자인식 전
-
문자인식 후
(예시) 1973년 외무부 기안문, 문자인식 전·후 비교표