팀 내 문서가 노션, 깃허브 이슈, S3 버킷에 흩어져 있을 때, 소스마다 커넥터를 따로 만드는 작업이 병목이 된다. OpenDocuments는 그 연결 작업을 미리 구현해 놓은 오픈소스 RAG 플랫폼이다.

커넥터가 12개 이상이다

노션, 깃허브, S3, PDF, Jupyter 노트북까지 연결된다. Ollama를 쓰면 외부 API 호출 없이 서버 안에서만 데이터가 돈다. 망 분리된 금융사나 유통사 환경에서 쓰기 좋은 구조다.

SQLite와 LanceDB 기반이라 도커 하나로 설치가 끝난다. 무거운 인프라 없이 붙이니 사이드 프로젝트나 팀 내부 도구로 올리기 부담이 없다. 설정만 마치면 파일이 들어올 때 임베딩과 저장이 동시에 처리된다. 관리자가 분류 작업을 따로 할 필요가 없다.

하이브리드 검색이 기본이다

벡터 검색과 키워드 방식을 섞은 하이브리드 검색에 리랭킹까지 붙어 있다. 한국어와 영어를 섞어서 질문해도 맥락을 잡아 출처를 명시해 준다. 답변 근거 문서를 표기해 주니까 할루시네이션 걱정이 줄어든다.

로컬에서 쓰다가 외부 고성능 API로 전환하는 것도 설정 한 줄이다. MCP 서버를 지원하니 코딩 에이전트에 바로 붙일 수 있고, 파서나 커넥터를 직접 추가하는 플러그인 구조도 열려 있다.


핵심만 뽑으면

  • Ollama 연동으로 외부 API 없이 온프레미스 RAG를 올리니 망 분리 환경에서도 쓸 수 있다
  • 하이브리드 검색에 리랭킹이 붙어 있어 한국어-영어 교차 질의에서도 출처가 맞게 나온다
  • MCP 서버를 지원하니 코딩 에이전트와 사내 지식 베이스를 바로 연결한다

원문: https://news.hada.io/topic?id=27910