노션, 깃허브 이슈, 위키 페이지가 제각각인 팀 환경에서 RAG를 구성하려면 소스마다 커넥터를 직접 만들어야 한다. OpenDocuments는 그 연결 작업을 미리 구현해 놓은 셀프호스팅 RAG 도구다.

설치는 한 줄이다

npm install 하나로 시작한다. API 키 자동 로딩이 붙어 있어서 수동 설정을 최소화하고, opendocuments doctor 명령어로 설정 오류를 바로 잡아낼 수 있다.

TypeScript와 Hono 기반이라 가볍다. SQLite와 LanceDB를 쓰니 별도 DB 서버 없이도 돌아간다. Ollama를 연결하면 외부 API 호출 없이 로컬에서만 처리된다. 금융사처럼 망 분리가 엄격한 환경에서 쓸 수 있는 구조다.

한국어-영어 교차 질의가 된다

PDF, Jupyter 노트북 등 다양한 포맷을 파싱하고 의미 단위로 쪼개서 벡터로 저장한다. 검색은 벡터 조회와 키워드 방식을 섞은 하이브리드 방식이다. 한국어로 물어봐도 영어 문서에서 답을 찾아오고, 답변에 출처 문서를 명시하니 할루시네이션을 걸러낼 수 있다.

MCP 서버를 지원하니 코딩 에이전트에서 사내 지식 베이스를 바로 질의할 수 있다. 모노레포 구조라 파서나 커넥터를 플러그인으로 직접 추가하는 것도 어렵지 않다. 수백 개 테스트 케이스가 깔려 있어서 커스텀 로직을 얹을 때 안정성 걱정이 덜하다.


핵심만 뽑으면

  • Ollama 연동으로 외부 API 없이 로컬에서만 데이터를 처리하니 망 분리 환경에 적합하다
  • 하이브리드 검색에 다국어 지원이 붙어 있어 한국어 질의로 영어 문서를 찾아온다
  • MCP 서버를 지원하니 코딩 에이전트와 사내 지식 베이스를 바로 연결할 수 있다

관련 글


참고 소스