노션, 깃허브 이슈, 위키 페이지가 제각각인 팀 환경에서 RAG를 구성하려면 소스마다 커넥터를 직접 만들어야 한다. OpenDocuments는 그 연결 작업을 미리 구현해 놓은 셀프호스팅 RAG 도구다. 설치는 한 줄이다 npm install 하나로 시작한다. API 키 자동 로딩이 붙어 있어서 수동 설정을 최소화하고, opendocuments doctor 명령어로 설정 오류를 바로 잡아낼 수 있다. TypeScript와 Hono 기반이라 가볍다. SQLite와 LanceDB를 쓰니 별도 DB 서버 없이도 돌아간다. Ollama를 연결하면 외부 API 호출 없이 로컬에서만 처리된다. 금융사처럼 망 분리가 엄격한 환경에서 쓸 수 있는 구조다. 한국어-영어 교차 질의가 된다 PDF, Jupyter 노트북 등 다양한 포맷을 파싱하고 의미 단위로 쪼개서 벡터로 저장한다. 검색은 벡터 조회와 키워드 방식을 섞은 하이브리드 방식이다. 한국어로 물어봐도 영어 문서에서 답을 찾아오고, 답변에 출처 문서를 명시하니 할루시네이션을 걸러낼 수 있다. MCP 서버를 지원하니 코딩 에이전트에서 사내 지식 베이스를 바로 질의할 수 있다. 모노레포 구조라 파서나 커넥터를 플러그인으로 직접 추가하는 것도 어렵지 않다. 수백 개 테스트 케이스가 깔려 있어서 커스텀 로직을 얹을 때 안정성 걱정이 덜하다. 핵심만 뽑으면 Ollama 연동으로 외부 API 없이 로컬에서만 데이터를 처리하니 망 분리 환경에 적합하다 하이브리드 검색에 다국어 지원이 붙어 있어 한국어 질의로 영어 문서를 찾아온다 MCP 서버를 지원하니 코딩 에이전트와 사내 지식 베이스를 바로 연결할 수 있다 관련 글 왜 DataNexus를 만드는가 — 흩어진 도메인 지식을 구조화하는 문제의식 4개의 오픈소스를 이 조합으로 결정하기까지 — RAG 엔진 선정 시 고려한 평가 기준 참고 소스 https://github.com/joungminsung/OpenDocuments https://news.hada.io/topic?id=27910