1. 복문일 경우 Apple Pie Parser가 복문의 범위를 scoping 하는 위치가 몇% correct한가?
관계사(접속사)의 Scoping 범위를 APP에서 Simulation한 결과 분석
복문 문장의 수 728문장
Scoping이 잘못된
문장의 수 145
정확도 약 80%
2. 원인 분석.
원인을 분석하면 다음의 유형이 대부분임.
Case 1: 관계사(접속사)로 쓰인 품사를 형용사로 취급하여 뒤의 단어까지 같이
Scoping하는 문제
Case 2: 관계사(접속사)의 용도를 지시 대명사로 취급하여 뒤의 단어까지 같이
Scoping하는 문제
Case 3: 관계사(접속사)의 Scope이 문장 끝까지 포함하는 불구하고 중간의 목적
절 앞에서 끝나는 것으로 간주하여 Scoping하는 문제.
Case 4: 관계사(접속사)의 Scope이 and로 연결되는 문장의 끝까지 인데 And
앞에서 끝나는 것으로 간주하여 Scoping하는 문제.
Case 5: 관계사(접속사)를 지시대명사의 주어로 쓰여 Scoping하는 문제.
3. Sentence가 복문 or 중문인 두 문장 이상의 합쳐진 문장일 때 문장의
끝을 알아내는 Algorithm 기술
복문 (중문) 경우의 절의 끝을 알기 위해서는 이 용도로 쓰이는 경우의
문장 구조를 먼저 살펴볼 필요가 있다.
문장의 case들을 분석해 보면
1. 하나의 Sentence S (이후 S1, S2와 같이 쓰임)를 다음과 같이 정의:
NP (S) + VP
NP (S) + VP + 부사구(ADVP) or 형용사구(ADJP)
NP (S) + VP + 전치사구(PP)
전치사구(PP) + NP (S…(생략)
4. 알고리즘 기술
5. 알고리즘에 쓰인 함수
6. Flow chart
|
정의되어 있지는 않지만 주 소스의 내용을 가지고 있으며
input sentence로부터 한 단어씩 Fetch하여 품사를 결정하고 적당한 Algorithm을
통해 Sentence의 시작과 끝을 표시함.
int What_Conjunction(char[]) : 한 단어를 읽어서 함수 내에 정의되어 있는 접속사
DB를 읽어 들여 해당하는 접속사(관계 대명사) 정의를 리턴 함.
void Mark(char &ch) : Sentence의 시작을 알리는 ‘(‘ 와 끝을 알리는 ‘)’을 표시하는
함수
6. Flow chart