IRC logging 및 검색 모델

한 두달전부터 생각해오고 있는것이 있습니다. IRC의 로그들을 저장하고 검색하기 위한 모델의 구현입니다. 사실 IRC의 통계 부문에 대해서는 괄목할만한 성장이 이뤄진 것으로 알고 있습니다. pisg와 같은 솔루션이 바로 그것이군요. 다양한 플랫폼에서 지원가능하며, 실제로 제가 있는 채널들의 로그를 재미삼아 통계낼 때에도 저것을 사용하고 있습니다.

그렇지만, 다음과 같은 것들을 지원하기 위한 솔루션이 있는걸까요?
가령, '어떤 사람이 말한 것'만을 모아서 보고싶다든지, 갑작스럽게 대화의 템포가 빨라질때, 또는 템포가 느려질 때를 알고 싶다든지, 그럴때에는 어떤 단어가 빈번하게 사용되고 어떤 사람이 주역이 되는지, 각각의 사람들이 활동하는 시간의 추이를 알고싶다든지...

pisg와 같은 프로그램에서 사용하는 파서 등을 보니 일단 대화나 이벤트는 쉽게 분리가능할 것으로 생각됩니다. 또 특정 인물의 대화록만 보는 것도 쉬울 것으로 생각되고... 다만, 대화의 템포를 별도로 인덱싱하기 위해서는 시간 혹은 타자수를 기반으로 하는 별도의 인덱싱 구조가 필요할것 같습니다. 단어별로 구분하는 것은 한국어를 조금 연구해야 할 것으로 생각되고,...

이와 같은 생각을 하게 된 것은, IRC에서 채팅할때 재미있는 대화 부분을 쉽게 뽑아내기 위해서입니다. 가령, 예전에 모 사설BBS의 모 대화방에서는 재미있는 대화를 캡쳐해서 '누구의 무슨무슨 시리즈' 이런 식으로 이어갔던것 같지 말입니다. 그런데 이런 과정이 자동화되면 나름 재미있지 않을까요? 물론 아직 의미론적 분석기법 등이 발전한게 아니기 때문에, 최종적으로 어떤 대화의 주제가 분리되어 나오면 사람이 인덱싱할 필요도 있겠지 말이죠.

아무튼... 아, 혹시 아이디어에 통참하고 싶은 분이 있다면 초장기 프로젝트-_-로 진행하는것도 좋겠군요. 만일 제가 개발하면 기본적으로 윈도우 플랫폼에 MFC 기반, 그리고 초기에는 MySQL과 같은 데이터베이스 지원으로 갈것 같군요.
2006/06/30 06:00 2006/06/30 06:00
2006/06/30 06:00 diary/plan
0 6
Trackback URL >> http://11471178.net/tt/trackback/479
  1. luapz  2006/06/30 08:00     댓글주소  수정/삭제  댓글쓰기
    스토킹 변태짓을 아직도 다 못버렸군하(...)
    • AKI  2006/06/30 11:43     댓글주소  수정/삭제
      부정적으로 생각하면 한없이 부정적으로 발전하게 마련이지.
      긍정적인 면도 생각해보라고.
  2. 세이링  2006/07/02 00:45     댓글주소  수정/삭제  댓글쓰기
    하지만 그게 맞는 말일지도 ~_~?
  3. 은규  2006/07/04 22:28     댓글주소  수정/삭제  댓글쓰기
    윈도우 환경에서 DB를 사용하고 싶다면
    sqlite를 써바
    함수 3개만 알면 디비 프로그래밍 끝~
코멘트 부탁드려요~*
[로그인][오픈아이디란?]