通常用C语言库函数写入的都是ANSI编码格式的文本文件,有时数据处理需要的是UTF-8格式的文本文件。
先将字符串编码转换为UTF-8格式的,然后再写入。
另一种方式可供参考:为 fopen 指定utf-8编码格式,然后写入 wchar_t 字符串,最终写入的文件就是UTF-8编码的了。
附代码1:
#include <stdio.h> #include <string.h> #include <Windows.h> int main() { FILE* fp = fopen("original.txt", "wb+"); // 写入UTF-8的BOM文件头 char header[3] = {(char)0xEF, (char)0xBB, (char)0xBF}; fwrite(header, sizeof(char), 3, fp); char* str = "Hello, 你好!"; int len = strlen(str); wchar_t *wc = (wchar_t *)malloc(sizeof(wchar_t)*len); //wchar_t wc[256]; // 将ANSI编码的多字节字符串转换成宽字符字符串 int n = MultiByteToWideChar(CP_ACP, 0, str, len, wc, len); if ( n > 0 ) { wc[n] = 0; char *mb = (char *)malloc(sizeof(char)*len*4); // char mb[1024]; // 将宽字符字符串转换成UTF-8编码的多字节字符串 n = WideCharToMultiByte(CP_UTF8, 0, wc, wcslen(wc), \ mb, len*4, NULL, NULL); if ( n > 0 ) { mb[n] = 0; fwrite(mb, sizeof(char), strlen(mb), fp); printf("写入成功!"); } free(mb); } free(wc); fclose(fp); system("pause"); return 0; }
附代码2:
#include <stdio.h> #include <tchar.h> #include <locale.h> wchar_t * char2wchar(const char* cchar) ; int main() { FILE* fp = fopen("test.txt", "wt+,ccs=UTF-8"); char *str = "hello, 你好!"; wchar_t* s = char2wchar(str); fwrite(s, sizeof(wchar_t), wcslen(s), fp); fclose(fp); return 0; } wchar_t * char2wchar(const char* cchar) { wchar_t *m_wchar; int len = MultiByteToWideChar( CP_ACP ,0,cchar ,strlen( cchar), NULL,0); m_wchar= new wchar_t[len+1]; MultiByteToWideChar( CP_ACP ,0,cchar,strlen( cchar),m_wchar,len); m_wchar[len]= '\0' ; return m_wchar; }
-End-