← 커뮤니티
발견했어요더노코즈 · 4월 15일

Microsoft MarkItDown — PDF, Word, PPT, 이미지 등 모든 파일을 마크다운으로 변환

마이크로소프트가 오픈소스로 공개한 Python 도구입니다. PDF, PowerPoint, Word, Excel, 이미지, 오디오, HTML, CSV, JSON, XML, ZIP까지 거의 모든 포맷을 마크다운으로 변환해줍니다. LLM에 문서를 넣을 때 전처리 파이프라인으로 바로 쓸 수 있고, MCP 서버도 지원해서 Claude Desktop에서 바로 연동 가능합니다. OCR 플러그인으로 이미지 속 텍스트 추출도 됩니다. pip install markitdown[all] 한 줄이면 설치 끝.
github.com

댓글

아직 댓글이 없습니다. 첫 번째 댓글을 남겨주세요!