当前位置:   article > 正文

C++ MFC中如何根据不同文件编码格式读取和显示文件内容_c++ 读取unicode文件

c++ 读取unicode文件

上一篇,介绍了写文件,这一篇我要介绍的如何读取文件内容并显示出来

这里假设VC++的字符集编码格式是Unicode,要显示的文本内容是strResult

1、读取ANSI编码格式的文本文件

  1. CStdioFile file;
  2. if (!file.Open(strFileName, CFile::modeRead | CFile::typeBinary))
  3. return;
  4. // 读取文件内容到CStringA对象中
  5. CStringA ansiString;
  6. ULONGLONG nLength = file.GetLength();
  7. LPSTR lpszString = ansiString.GetBufferSetLength(nLength + 1);
  8. file.Read(lpszString, (UINT)nLength);
  9. lpszString[nLength] = '\0';
  10. ansiString.ReleaseBuffer();
  11. file.Close();
  12. USES_CONVERSION;
  13. CString strResult = A2W(ansiString);

2、读取utf-8编码格式的文本文件

  1. CStdioFile file;
  2. if (!file.Open(strFileName, CFile::modeRead | CFile::typeBinary))
  3. return;
  4. //获取文件头
  5. unsigned char bom[3] = { 0 };
  6. file.Read(bom, 3);
  7. // 判断文件类型
  8. if (bom[0] == 0xEF && bom[1] == 0xBB && bom[2] == 0xBF)
  9. {
  10. //utf8 0xEF, 0xBB, 0xBF
  11. CStringA utf8String;
  12. ULONGLONG nLength = file.GetLength() - 3;
  13. LPSTR lpszString = utf8String.GetBufferSetLength(nLength);
  14. file.Read(lpszString, (UINT)nLength);
  15. utf8String.ReleaseBuffer();
  16. file.Close();
  17. // 获取UTF-8字符串的长度(以字节为单位)
  18. int utf8Length = utf8String.GetLength();
  19. // 获取转换为Unicode所需的缓冲区大小(以字符为单位)
  20. int unicodeBufferSize = MultiByteToWideChar(CP_UTF8, 0, utf8String, utf8Length, NULL, 0);
  21. // 分配足够大的缓冲区来保存转换后的Unicode字符串
  22. wchar_t* unicodeBuffer = new wchar_t[unicodeBufferSize + 1];
  23. // 将UTF-8字符串转换为Unicode编码
  24. MultiByteToWideChar(CP_UTF8, 0, utf8String, utf8Length, unicodeBuffer, unicodeBufferSize);
  25. // 确保Unicode字符串以null结尾
  26. unicodeBuffer[unicodeBufferSize] = L'\0';
  27. // 将Unicode字符串存储在一个CStringW对象中
  28. CString strResult(unicodeBuffer);
  29. }

3、读取unicode-le编码格式的文本文件

  1. CStdioFile file;
  2. if (!file.Open(strFileName, CFile::modeRead | CFile::typeBinary))
  3. return;
  4. //获取文件头
  5. unsigned char bom[2] = { 0 };
  6. file.Read(bom, 2);
  7. // 判断文件类型
  8. if (bom[0] == 0xFF && bom[1] == 0xFE)
  9. {
  10. CString strResult;
  11. ULONGLONG nLength = (file.GetLength() - 2);
  12. LPWSTR lpszString = strResult.GetBufferSetLength(nLength + 1);
  13. file.Read(lpszString, (UINT)nLength);
  14. lpszString[nLength / 2] = '\0';
  15. strResult.ReleaseBuffer();
  16. file.Close();
  17. }

4、读取unicode-be编码格式的文本文件

  1. CStdioFile file;
  2. if (!file.Open(strFileName, CFile::modeRead | CFile::typeBinary))
  3. return;
  4. //获取文件头
  5. unsigned char bom[2] = { 0 };
  6. file.Read(bom, 2);
  7. // 判断文件类型
  8. if (bom[0] == 0xFE && bom[1] == 0xFF)
  9. {
  10. CString unicodeString;
  11. ULONGLONG nLength = (file.GetLength() - 2);
  12. LPWSTR lpszString = unicodeString.GetBufferSetLength(nLength + 1);
  13. file.Read(lpszString, (UINT)nLength);
  14. lpszString[nLength / 2] = '\0';
  15. unicodeString.ReleaseBuffer();
  16. file.Close();
  17. // 获取Unicode-LE编码字符串的长度(以字符为单位)
  18. int unicodeLELength = unicodeString.GetLength();
  19. // 分配足够大的缓冲区来存储转换后的Unicode-BE编码字符串
  20. wchar_t* unicodeLEBuffer = new wchar_t[unicodeLELength];
  21. // 将Unicode-LE编码字符串的每个字符转换为Unicode-BE编码,并写入新的缓冲区中
  22. for (int i = 0; i < unicodeLELength; i++) {
  23. wchar_t ch = unicodeString[i];
  24. unsigned char highByte = (ch >> 8) & 0xFF;
  25. unsigned char lowByte = ch & 0xFF;
  26. unicodeLEBuffer[i] = (lowByte << 8) | highByte;
  27. }
  28. // 创建一个新的CString对象,并将转换后的Unicode-BE编码字符串分配给它
  29. CString strResult(unicodeLEBuffer, unicodeLELength);
  30. }

注意事项:如果需要将文本内容显示在界面的CEdit控件里面去,还需要处理一下换行符号,否则文本内容显示不会自动换行,具体代码如下:

  1. strResult.Replace(_T("\n"), _T("\r\n"));
  2. SetDlgItemText(IDC_TEXT, strResult);

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/123110?site
推荐阅读
相关标签
  

闽ICP备14008679号