HWP · HWPX 포맷 심층 가이드

한컴 HWP / HWPX 가 무엇이고, 왜 변환 시 서식이 깨지며, 어떤 방법이 가장 손실이 적은지.

1. HWP 란 무엇인가

HWP는 한국에서 가장 널리 쓰이는 워드 프로세서 한컴 한글(Hangul Word Processor)의 기본 문서 포맷입니다. 공공기관·학교·법원·다수 기업에서 사실상 표준으로 사용되며, 레거시 .hwp는 한컴이 소유한 바이너리 포맷입니다. 2010년 이후 한컴은 국가표준 KS X 6101 에 기반한 HWPX(ZIP + XML 구조) 를 공개했고, 2023년 이후 공공기관에서는 hwpx 가 기본 저장 포맷으로 확산되고 있습니다.

2. 변환 시 서식이 깨지는 이유

  • 레거시 hwp 바이너리는 한컴오피스 내부에서만 완전히 명세되어 있습니다. 오픈소스 렌더러(hwp5, LibreOffice)는 역공학으로 구현했기 때문에, 표 셀 정렬·각주 앵커·일부 도형의 위치가 조금씩 틀어질 수 있습니다.
  • 한글 전용 폰트(바탕·굴림·맑은 고딕·HY계열)가 문서에는 지정돼 있어도 파일에 임베드되지 않는 경우가 많습니다. 변환 서버에 해당 폰트가 없으면 네모(□)로 나오거나 다른 폰트로 대체되어 줄바꿈 위치가 달라집니다.
  • 한컴 고유 기능(각장·드롭캡·머릿말 분리선·혼합 단 표 등)은 PDF 매핑이 깔끔하지 않아 위치·여백이 어긋날 수 있습니다.

3. 어떤 포맷으로 저장해야 안전한가

새로 작성하는 문서라면 HWPX 로 저장하세요. 국가표준으로 공개돼 있어 LibreOffice 를 포함한 서드파티 도구가 더 충실히 지원합니다. 이미 축적된 레거시 hwp 자료는 한컴 공식 뷰어로 변환하는 것이 가장 안전한 선택입니다.

4. 방법별 서식 보존율 랭킹

  1. 한컴 오피스 뷰어 + Print to PDF (Windows · 무료) — 한컴 자체 엔진 사용, 사실상 100% 보존.
  2. 네이버 오피스 → PDF 저장 — 한컴 렌더 파이프라인 라이선스 기반, 위와 거의 동급에서 일부 도형만 드리프트.
  3. LibreOffice --convert-to pdf — hwpx 는 우수, 단순 hwp 는 양호, 복잡 표·각주는 어긋날 수 있음.
  4. 범용 온라인 변환기 — 마지막 선택지. 폰트·레이아웃 품질 편차 큼.

5. 프라이버시 · 개인정보 이슈

공공기관 hwp 문서는 주민등록번호·주소·계약 상대방 정보를 포함하는 경우가 많습니다. 제3자 온라인 변환기에 업로드하는 것은 피하고, 로컬 LibreOffice 또는 오프라인 PC 의 한컴 뷰어를 사용하세요. 파일이 단 한 번이라도 외부 서버에 저장되면 개인정보보호법상 이슈가 생길 수 있습니다.

6. 대량 변환 템플릿

# LibreOffice 사전 설치 필요
mkdir -p pdf
for f in *.hwp *.hwpx; do
  [ -e "$f" ] || continue
  soffice --headless --convert-to pdf --outdir pdf "$f"
done

macOS · Linux · Windows(WSL) 공통으로 동작합니다. 신규 머신에서는 한글 시스템 폰트(우분투 fonts-noto-cjk, macOS Noto Sans CJK KR)를 먼저 설치해야 네모(□) 출력이 없습니다.

7. HWP ↔ DOCX ↔ PDF 중간 변환 주의

HWP → DOCX → PDF 와 같이 중간 단계를 거치면 레이아웃 드리프트가 두 번 누적됩니다. 최종 목적지가 PDF 라면 중간 DOCX 를 거치지 말고 직접 PDF 로 변환하는 것이 서식 보존에 유리합니다.

변환 방법 화면으로 돌아가기