예전에 초안으로 적어놓은걸 올립니다.ㅎㅎ
(물론 약간은 수정 했습니다. 개인적으로 보려고 쓴 글이기 때문에.)
처음엔 그냥 스크랩 용도로 쓰려고 했었는데, 기능을 확장했습니다. 카테고리 기능이나 중복 검사 기능등... 그래서 처음 만든 프로그램을 싹 갈아엎고 버전 2를 만들었습니다.
쿼리분석, 패킷분석도 하려고 했는데, 그만 접어버리고 말았네요,
블로그 첫번짼가 두번째 게시물에 있는대로 raw 데이터를 처리하기가 꽤나 번거로워서-_-;;
지금은 소스, 프로그램이 어딨는지도 모르겠네요.;;
예전에 스샷 찍어놓은걸로 대신 해야하겠습니다. ㅡㅜ
환경 : c#.net + php + mysql
=================
예전부터 생각해온 프로그램들 만드는 중입니다.
그중 하나가 개인지식경영시스템(PKMS)을 구축하는 것입니다.
인터넷으로 지식을 얻는 경우가 상당하기 때문에, 모든 인터넷 접속 사이트 내용을 분류별로 저장하고 그 데이터를 기반으로 한 검색엔진을 통해 본인에게 유용한 정보를 즉시 뽑아내는 시스템이라고 하면 될까요.
현재 raw데이터 그대로를 사용해서 자원소모가 심하지만 곧 필터링 모듈을 구현할 예정입니다
이 프로그램에 덧붙였으면 좋을것 같은게 뭐냐면, scrawling 모듈과 searching 모듈
결국 고딩 수2를 다시(가 아니고 처음이라고 해야하나) 배워야 할까요?
검색엔진 이론에는 벡터가 들어간다고 합니다. 서로의 연관성을 벡터로 표현해서 가장 근접한 결과물을 출력하는것이 검색엔진의 효율을 결정한다고 하더군요.


댓글 없음:
댓글 쓰기