Httpclient를 사용해서 웹 페이지 EUC-KR 인코딩 문제 해결하기

아파치 프로젝트 중의 하나인 HttpClient는 HTTP 프로토콜을 사용해서 요청/응답을 쉽게 하도록 도와주는 라이브러리이다. 이제는 국내 웹 사이트도 웹 페이지를 EUC-KR로 처리하는 경우는 거의 없지만, EUC-KR로 인코딩을 사용하는 웹 페이지는 한글이 깨지게 된다. HttpClient의 기본 인코딩이 UTF-8이기 때문이다.


바로 위와 같이 한글이 깨지게 된다.

위 문제를 해결하기 위해서는 전송받은 데이터를 제대로 보여줄 수 있는 캐릭터로 인코딩하면 된다. 

String y = new String(x.getBytes("iso-8859-1"));

위와 같이, 전송 받은 데이터를 String 변수인 x에 저장하고, 다시 x를 적합한 캐릭터(iso-8859-1)로 인코딩 해서 String y에 저장을 하면 한글이 잘 나오게 된다.

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.