이건 prefix 검색이 되고 string matching이 좀 빠르다는 장점이 있어서 형태소 분석기 사전에 많이 쓰인다. exact matching 자체는 hash table보다 느리고 빌딩 시에 메모리도 상상을 초월할 정도로 많이 먹는 등... prefix 검색이 아니라면 그리 좋은 구조는 아니다.
사실 내가 직접 형태소 분석기를 개발할 일이 없었기 때문에 그냥 교과서에서만 대충 보고 지나쳤고 탑코더 연습문제로 간단하게 짜본 거 외에 직접 구현해본 적은 없는데... 회사에서 Aho-Corasic을 포함하여 여러 가지 string matching 데이터 구조를 테스트한다는 이야기를 듣고 문득 트라이를 구현해보고 싶어졌다.
선택한 알고리즘과 구조는 모란소프트 조영환 박사님꺼... 그림을 보고 고대로 구현해서 엔씨 오픈마루 심보준님에게 성능 비교를 의뢰한 바.. ㅋㅋㅋ 내께 조금 더 빨랐단다.
사실 이 포스팅은 이거 자랑하려고 ^^
조박사님 트라이 포스팅이 얼마나 유명하면 구글에서 '한국어 웹' 검색으로 trie라고 치면 1등으로 나온다.
http://hanigamo.egloos.com/1001847
사실 내가 직접 형태소 분석기를 개발할 일이 없었기 때문에 그냥 교과서에서만 대충 보고 지나쳤고 탑코더 연습문제로 간단하게 짜본 거 외에 직접 구현해본 적은 없는데... 회사에서 Aho-Corasic을 포함하여 여러 가지 string matching 데이터 구조를 테스트한다는 이야기를 듣고 문득 트라이를 구현해보고 싶어졌다.
선택한 알고리즘과 구조는 모란소프트 조영환 박사님꺼... 그림을 보고 고대로 구현해서 엔씨 오픈마루 심보준님에게 성능 비교를 의뢰한 바.. ㅋㅋㅋ 내께 조금 더 빨랐단다.
사실 이 포스팅은 이거 자랑하려고 ^^
조박사님 트라이 포스팅이 얼마나 유명하면 구글에서 '한국어 웹' 검색으로 trie라고 치면 1등으로 나온다.
http://hanigamo.egloos.com/1001847


댓글을 달아 주세요