메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이정훈 (부산대학교, 부산대학교 대학원)

지도교수
권혁철
발행연도
2017
저작권
부산대학교 논문은 저작권에 의해 보호받습니다.

이용수2

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (8)

초록· 키워드

오류제보하기
자연언어 처리 ( natural language processing ) 분야에서는 대용량 데이터를 활용한 기법과 심층학습 (deep learning) 을 이용한 방법이 다양하게 시도되고 있다 . 인터넷의 일상화에 따라 지난 수천 년간 생성된 텍스트 양만큼의 데이터가 하루에 생성이 되고 있으 며 , 질 또한 상당히 높아졌다 . 그러나 이런 데이터를 효과적으로 활용하는 집단은 거의 없다 . 가장 큰 이유는 인간이 처리하기는 불가능하며 , 자동으로 처리하기에는 언어처리 기술에 한계가 있기 때문이다 . 정보의 양 외에도 접근 가능한 정보의 다양성과 질도 또 다른 장벽일 것이다 . 물론 최근 도입된 심층학습이 언어정보 처리 분야에서도 새로이 주목을 받고 있으며 , 일부 심층학습 플랫폼이 도구를 제공하고 있다 . 그러나 아직 연구 경험이 부족하여 실용화 시스템에 적용하기에는 한계가 있다 . 따라서 대용량 말뭉치를 바탕으로 한 통계적 접근 방법이 대용량 텍스트 정보 처리에 효과적일 것으로 본다 . 통계적 방법은 분석 대상 문서 자체의 통계 정보를 추가함으로써 단계적으로 시스템의 성능을 향상할 수 있는 장점이 있다 . 본 논문에서의 문맥의존 철자오류 교정기법은 기존의 통계적인 방식에서 주로 사용되는 단일한 말뭉치가 아닌 두 종류의 대용량 말뭉치를 이용하여 보간 기법을 적용하였다 . 보간 기법은 대용량 말뭉치 각각의 특성 ( 정보량 , 정확도 ) 을 살려 성능을 높인다 . 그리고 Default 연산 알고리즘의 적용을 통해서 속도 , 데이터 저장 , 교정 성능을 높인다 .

목차

제1장 서론 2
제2장 관련 연구 5
2.1. 문맥의존 철자오류 교정 연구 현황 5
2.1.1. 대용량 말뭉치를 이용한 연구 현황 6
제3장 통계적 문맥의존 철자오류 교정 기법 8
3.1. 노이지 채널 모형 8
3.2. 통계적 문맥의존 철자오류 교정 모델 11
3.2.1. 교정 어휘 쌍과 전체 어절을 대상어로 한 교정 14
3.3. 다양한 평탄화를 적용한 문맥의존 철자오류 교정 15
3.4. 대용량 말뭉치 간의 보간을 적용한 문맥의존 철자오류 교정 16
3.4.1. 대용량 말뭉치 18
3.5. Default 연산 알고리즘을 적용한 문맥의존 철자오류 교정 22
제4장 실험 및 평가 33
4.1. 실험 평가 방법 33
4.2. 두 대용량 말뭉치 간의 보간을 적용한 교정 실험 35
4.2.1. 실험 환경 35
4.2.2. 실험 결과 36
4.3. Default 연산 알고리즘을 적용 한 교정 실험 38
4.3.1. 실험 환경 38
4.3.2. 실험 결과 38
제5장 결론 및 향후 연구 42

최근 본 자료

전체보기

댓글(0)

0