프로그램/C++

[MFC] 유니코드 멀티바이트 UTF-8 문자열 인코딩 변환 모음

네오류이 2021. 1. 10. 13:03
728x90
반응형

출처 : http://yeobi27.tistory.com/entry/MFC-%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C-%EB%A9%80%ED%8B%B0%EB%B0%94%EC%9D%B4%ED%8A%B8-UTF8-%EB%AC%B8%EC%9E%90%EC%97%B4-%EC%9D%B8%EC%BD%94%EB%94%A9-%EB%B3%80%ED%99%98-%EB%AA%A8%EC%9D%8C

 

 

[MFC] 유니코드 멀티바이트 UTF-8 문자열 인코딩 변환 모음

 

유니코드 -> 멀티바이트

1

2

3

4

5

wchar_t strUnicode[256] = {0,};

char    strMultibyte[256] = {0,};

wcscpy_s(strUnicode,256,L"유니코드");

int len = WideCharToMultiByte( CP_ACP, 0, strUnicode, -1, NULL, 0, NULL, NULL );   

WideCharToMultiByte( CP_ACP, 0, strUnicode, -1, strMultibyte, len, NULL, NULL );

stl이용

1

2

3

4

wstring strUni = L"유니코드";

int len = WideCharToMultiByte( CP_ACP, 0, &strUni[0], -1, NULL, 0, NULL, NULL );

string strMulti(len,0);

WideCharToMultiByte( CP_ACP, 0,  &strUni[0], -1, &strMulti[0], len, NULL, NULL );


멀티바이트 -> 유니코드

1

2

3

4

5

wchar_t strUnicode[256] = {0,};

char    strMultibyte[256] = {0,};

strcpy_s(strMultibyte,256,"멀티바이트");

int nLen = MultiByteToWideChar(CP_ACP, 0, strMultibyte, strlen(strMultibyte), NULL, NULL);

MultiByteToWideChar(CP_ACP, 0, strMultibyte, strlen(strMultibyte), strUnicode, nLen);

stl이용

1

2

3

4

string strMulti = "멀티바이트"; 

int nLen = MultiByteToWideChar(CP_ACP, 0, &strMulti[0], strMulti.size(), NULL, NULL);

wstring strUni(nLen,0);

MultiByteToWideChar(CP_ACP, 0, &strMulti[0], strMulti.size(), &strUni[0], nLen);


유니코드 -> UTF-8

1

2

3

4

wchar_t strUni[256] =L"유니코드";

char strUtf8[256] ={0,};

int nLen = WideCharToMultiByte(CP_UTF8, 0, strUni, lstrlenW(strUni), NULL, 0, NULL, NULL);

WideCharToMultiByte (CP_UTF8, 0, strUni, lstrlenW(strUni), strUtf8, nLen, NULL, NULL);


UTF-8 -> 유니코드로 변환

1

2

3

4

5

    wchar_t strUnicode[256] = {0,};

char    strUTF8[256] = {0,};

strcpy_s(strUTF8,256,"utf-8글자..");// 이건 사실 멀티바이트지만 UTF8이라고 생각해주세요 -_-;;

int nLen = MultiByteToWideChar(CP_UTF8, 0, strUTF8, strlen(strUTF8), NULL, NULL);

MultiByteToWideChar(CP_UTF8, 0, strUTF8, strlen(strUTF8), strUnicode, nLen);


기본적으로 UTF-8로 변형할땐 유니코드 상태에서만 변형을 시켜야 된다!.

 만약 멀티 바이트를 UTF-8로 변형하고 싶을때에는
   멀티바이트 -> 유니코드(UTF-16) -> UTF-8 
UTF-8을 멀티바이트로 변형할때에는
   UTF-8 -> 유니코드(UTF-16) -> 멀티바이트..
 


그런데 위와 같은 방식은.. 윈도우 환경에서만 사용한다면 너무 복잡하다...

우리 위대하신 MS에서 만들어주신게 있는데..

1

2

3

4

5

6

7

8

9

10

11

12

#include <atlstr.h> // 요기에 정의..  이거하면 MFC사용안하고도 CString를 사용할수 있다

void main()

{

  wstring strUni = CA2W("멀티바이트를 유니코드로 변환");

  string strMulti = CW2A(L"유니코드를 멀티바이트로 변환");

  string strUTF8 = CW2A(L"유니코드를 UTF8로변환",CP_UTF8);

  //string에서 포인터 얻어오는게 c_str()이듯.

  //CA2W나 CW2A에서 포인터 얻어오는건 m_psz 이다..

  //그리고 CA2W CW2A는 기본적으로 CString 즉 (CAtlString)에 기반을 두고 고 있기때문에.

  //CString를 사용할때 가장 빠른다!!.

  // 만약 멀티 플레폼을 기준으로 한다면 CA2W는 사용 못함!

}


사용하기도 쉽고 속도면에서 MultiByteToWideChar,WideCharToMultiByte 보다 빠르다...

728x90
반응형