티스토리 뷰

http://cpplog.tistory.com/19 에서 긁어옴.

string(multi-byte string)과 wstring(wide-char string)을 상호 변환하는 방법을 알아보자. 보통 mbstowcs와 wcstombs 함수를 사용하거나 윈도우즈 환경에서는 MultiByteToWideChar와 WideCharToMuliByte 함수를 사용해서 구현하는데 여기서는 STL의 codecvt를 사용해서 구현했다. (codecvt는 문자를 인코딩하는데 사용된다. )

multi-byte string을 wide-char string으로 변환하는 코드
std::wstring
mbs_to_wcs(std::string const& str, std::locale const& loc = std::locale())
{
    typedef std::codecvt<wchar_t, char, std::mbstate_t> codecvt_t;
    codecvt_t const& codecvt = std::use_facet<codecvt_t>(loc);
    std::mbstate_t state = std::mbstate_t();
    std::vector<wchar_t> buf(str.size() + 1);
    char const* in_next = str.c_str();
    wchar_t* out_next = &buf[0];
    std::codecvt_base::result r = codecvt.in(state,
        str.c_str(), str.c_str() + str.size(), in_next,
        &buf[0], &buf[0] + buf.size(), out_next);
    if (r == std::codecvt_base::error)
        throw std::runtime_error("can't convert string to wstring");  
    return std::wstring(&buf[0]);
}

wide-char string을 multi-byte string으로 변환하는 코드
std::string
wcs_to_mbs(std::wstring const& str, std::locale const& loc = std::locale())
{
    typedef std::codecvt<wchar_t, char, std::mbstate_t> codecvt_t;
    codecvt_t const& codecvt = std::use_facet<codecvt_t>(loc);
    std::mbstate_t state = std::mbstate_t();
    std::vector<char> buf((str.size() + 1) * codecvt.max_length());
    wchar_t const* in_next = str.c_str();
    char* out_next = &buf[0];
    std::codecvt_base::result r = codecvt.out(state,
        str.c_str(), str.c_str() + str.size(), in_next,
        &buf[0], &buf[0] + buf.size(), out_next);
    if (r == std::codecvt_base::error)
       throw std::runtime_error("can't convert wstring to string");  
    return std::string(&buf[0]);
}

사용 예
// 전역 locale 설정
std::locale::global(std::locale(""));

std::string mbs1 = "abcdef가나다라";
std::wstring wcs1 = L"abcdef가나다라";
std::string mbs2 = wcs_to_mbs(wcs1);
assert(mbs1 == mbs2);
std::wstring wcs2 = mbs_to_wcs(mbs1);
assert(wcs1 == wcs2);

[수정 2007.04.15]
- GNU C++에서 compile 오류 문제 수정 (GNU C++에서는 mbstate_t가 integral type이 아님)
- 변환 실패 시 exception을 발생 시키도록 수정
댓글