unicode文本文档(Unicode文本文件怎么在XP下打开看啊)
本文目录
- Unicode文本文件怎么在XP下打开看啊
- Unicode文本文档是是么意思
- C语言如何读写unicode编码的文本文件
- unicode文本文件和文本文件有什么区别
- ★[有图]什么是RTF文档(RTF)什么是文本文档什么是文本文档-MS-DOS格式什么是Unicode文本文档…★
- 如何用VB读取Unicode文本文件
- 关于在VC6.0中打开Unicode文本文件
Unicode文本文件怎么在XP下打开看啊
windows xp的记事本,支持unicode(大端和小端的都支持),你打开直接看就可以了如果你发现都是口,可以用ultraedit打开,看看最前面几个字节:Unicode (默认都是小端的)是以FF FE开头的Unicode Big endian(大端的unicode)是以FF FE开头的UTF-8是以EF BB BF开头ANSI(包含GB)无开头标识,直接就是文件内容编码
Unicode文本文档是是么意思
说明此文本文档时使用unicode字符集编码的文本文件。常见的编码方式还有GBK,GB2312,ASSCII,utf-8,utf-16等等。不同的编码方式,体现在同样的字符或字母,保存成文件存储的时候,其占用的字节数,十六进制的表示代码都是不同的。例如汉字“好”的各种编码如下:GBK编码: 0xBAC3 unicode编码: 0x597D 区位码(GB2312): 0x2635 utf8编码: %E5%A5%BD
C语言如何读写unicode编码的文本文件
C语言读写文件有两种方式: 一种是文本方式,另一种是2进制方式。日文,中文,unicode, 都要用2进制方式。文件内容的编码和编码的转化,同一种编码的大端或小端编码,都要自己安排处理。
C语言不管读写都要通过fopen函数来,其中mode参数可以控制以二进制打开还是以文本方式打开。fopen的函数原型:FILE * fopen(const char * path,const char * mode);fopen函数的第一个参数是文件路径,第二个参数是打开方式,有以下几种方式: r 以只读方式打开文件,该文件必须存在。 r+ 以可读写方式打开文件,该文件必须存在。 rb+ 读写打开一个二进制文件,允许读数据。 rw+ 读写打开一个文本文件,允许读和写。 w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。 w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。 a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。(EOF符保留) a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。 (原来的EOF符不保留) wb 只写打开或新建一个二进制文件;只允许写数据。 wb+ 读写打开或建立一个二进制文件,允许读和写。 wt+ 读写打开或着建立一个文本文件;允许读写。 at+ 读写打开一个文本文件,允许读或在文本末追加数据。 ab+ 读写打开一个二进制文件,允许读或在文件末追加数据。 上述的形态字符串都可以再加一个b字符,如rb、w+b或ab+等组合,加入b 字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。
unicode文本文件和文本文件有什么区别
unicode文本是用unicode编码写成的文本。普通文本是用英文ASCII编码写成的文本。unicode用16位码,ASCII用7位码,编码涵义,各有各的定义。汉字国标码GB虽然也是16位码,但编码涵义与unicode完全不同。unicode文本除用16位码外还要有一定的结构,用来区分语种的开始结束。显示unicode文本,除须显示软件外,还要有相应的某国语言的 unicode font(字体文件)。
★[有图]什么是RTF文档(RTF)什么是文本文档什么是文本文档-MS-DOS格式什么是Unicode文本文档…★
RTF是富文本格式(Rich Text Format),有相应的工具可以打开,这种格式中可以包括字符和图片以及自己的涂鸦。文本文档只能保存纯字符信息,如txt就是文本文档。文本文档-MS-DOS格式?你说的是window批处理文件吧?是不是保存后的后缀是.bat?那么就是了。批处理文件是windows的dos命令的集合,可以看成一个可执行文件,双击后即可运行其内容中的命令。具体命令请参考dos命令。Unicode文本文档,Unicode是一个字符集,里面包括世界上各个国家的绝大部分常用以及不常用字符,当你在公众字符混合的文档的时候,保存为unicode个时候,再打开会显示正常,不然会全都是乱码的!如果doc保存的都是纯文本,那么你可以直接copy它的内容到一个记事本中,其中的内容不会丢失。WPS应该是WPS软件的文档后缀名吧?纯文本的wps可以copy到记事本中。wps与doc的转换,即使有相应的转化软件,我想效果也不是很好。毕竟微软想要一家做大,他会说:把我的doc与别的格式互相转化?想也别想!
如何用VB读取Unicode文本文件
可以转换啊StrConv 函数 返回按指定类型转换的 Variant (String)。 语法 StrConv(string, conversion, LCID) StrConv 函数的语法有下面的命名参数: 部分 说明 string 必要参数。要转换的字符串表达式。 conversion 必要参数。Integer。其值的和决定转换的类型。 LCID 可选的。如果与系统LocaleID不同,则为LocaleID(系统LocaleID为缺省值。) 设置值 conversion 参数的设置值为: 常数 值 说明 vbUpperCase 1 将字符串文字转成大写。 vbLowerCase 2 将字符串文字转成小写。 vbProperCase 3 将字符串中每个字的开头字母转成大写。 vbWide* 4* 将字符串中单字节字符转成双字节字符。 vbNarrow* 8* 将字符串中双字节字符转成单字节字符。 vbKatakana** 16** 将字符串中平假名字符转成片假名字符。 vbHiragana** 32** 将字符串中片假名字符转成平假名字符。 vbUnicode 64 根据系统的缺省码页将字符串转成 Unicode。 vbFromUnicode 128 将字符串由 Unicode 转成系统的缺省码页。 *应用到远东国别。 **仅应用到日本。 注意 这些常数是由 VBA 指定的。可以在程序中使用它们来替换真正的值。其中大部分是可以组合的,例如 vbUpperCase + vbWide,互斥的常数不能组合,例如 vbUnicode + vbFromUnicode。当在不适用的国别使用常数 vbWide、vbNarrow、vbKatakana,和 vbHiragana 时,就会导致运行时错误。 下面是一些一般情况下的有效分界符:Null (Chr$(0)),水平制表符 (Chr$(9)),换行 (Chr$(10)),垂直制表符 (Chr$(11)),换页 (Chr$(12)) ,回车 (Chr$(13)),空白 (SBCS) (Chr$(32))。在 DBCS中,空白的实际值会随国家/地区而不同。 说明 在把 ANSI 格式的 Byte 数组转换为字符串时,您应该使用 StrConv 函数。当您转换 Unicode 格式的这种数组时,使用赋值语句。
关于在VC6.0中打开Unicode文本文件
VC++ 6.0支持Unicode编程,但默认的是ANSI,所以开发人员只需要稍微改变一下编写代码的习惯便可以轻松编写支持UNICODE的应用程序。使用VC++ 6.0进行Unicode编程主要做以下几项工作:1、为工程添加UNICODE和_UNICODE预处理选项。 具体步骤:打开对话框,在C/C++标签对话框的“预处理程序定义”中去除_MBCS,加上_UNICODE,UNICODE。(注意中间用逗号隔开). 在没有定义UNICODE和_UNICODE前,所有函数和类型都默认使用ANSI的版本;在定义了UNICODE和_UNICODE之后,所有的MFC类和Windows API都变成了宽字节版本了。2、设置程序入口点 因为MFC应用程序有针对Unicode专用的程序入口点,我们要设置entry point。否则就会出现连接错误。 设置entry point的方法是:打开对话框,在Link页的Output类别的Entry Point里填上wWinMainCRTStartup。3、使用ANSI/Unicode通用数据类型 微软提供了一些ANSI和Unicode兼容的通用数据类型,我们最常用的数据类型有_T ,TCHAR,LPTSTR,LPCTSTR。 顺便说一下,LPCTSTR和const TCHAR*是完全等同的。其中L表示long指针,这是为了兼容Windows 3.1等16位操作系统遗留下来的,在Win32 中以及其它的32位操作系统中,long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。P(pointer)表示这是一个指针;C (const)表示是一个常量;T(_T宏)表示兼容ANSI和Unicode,STR(string)表示这个变量是一个字符串。综上可以看出, LPCTSTR表示一个指向常固定地址的可以根据一些宏定义改变语义的字符串。比如:TCHAR* szText=_T(“Hello!”);TCHAR szText=_T(“I Love You”);LPCTSTR lpszText=_T(“大家好!”);使用函数中的参数最好也要有变化,比如:MessageBox(_T(“你好”)); 其实,在上面的语句中,即使您不加_T宏,MessageBox函数也会自动把“你好”字符串进行强制转换。但我还是推荐您使用_T宏,以表示您有Unicode编码意识。4、修改字符串运算问题 一些字符串操作函数需要获取字符串的字符数(sizeof(szBuffer)/sizeof(TCHAR)),而另一些函数可能需要获取字符串的字节数sizeof(szBuffer)。您应该注意该问题并仔细分析字符串操作函数,以确定能够得到正确的结果。ANSI操作函数以str开头,如strcpy(),strcat(),strlen();Unicode操作函数以wcs开头,如wcscpy,wcscpy(),wcslen();ANSI/Unicode操作函数以_tcs开头 _tcscpy(C运行期库);ANSI/Unicode操作函数以lstr开头 lstrcpy(Windows函数);考虑ANSI和Unicode的兼容,我们需要使用以_tcs开头或lstr开头的通用字符串操作函数。六、举个Unicode编程的例子第一步: 打开VC++6.0,新建基于对话框的工程Unicode,主对话框IDD_UNICODE_DIALOG中加入一个按钮控件,双击该控件并添加该控件的响应函数:void CUnicodeDlg::OnButtonUnicode() { TCHAR* str1=_T("ANSI和UNICODE编码试验"); m_disp=str1; UpdateData(FALSE);} 添加静态文本框IDC_DISP,使用ClassWizard给该控件添加CString类型变量m_disp。使用默认ANSI编码环境编译该工程,生成Unicode.exe。第二步:修改系统内码 打开“控制面板”,单击“日期、时间、语言和区域设置”选项,在“日期、时间、语言和区域设置”窗口中继续单击“区域和语言选项”选项,弹出“区域和语言选项”对话框。在该对话框中,单击“高级”标签,将“非Unicode的程序的语言”选项改为“日语”,单击“应用”按钮,弹出的对话框单击“是”,重新启动计算机使设置生效。运行Unicode.exe程序并单击“Button1”按钮,看,静态文本框出现了乱码。第三步: 改为Unicode编码环境编译该工程,生成Unicode.exe。再次运行Unicode.exe程序并单击“Unicode”按钮。看到Unicode编码的优势了吧。操作:到底什么是ANSI,什么是UNICODE呢?其实这是两种不同的编码方式标准,ANSI中的字符采用8bit,而UNICODE中的字符采用16bit。8bit的ANSI编码只能表示256种字符,表示26个英文字母是绰绰有余的,但是表示汉字,韩国语,日语等有着成千上万个字符的非西方字符肯定就不够了,正是如此才引入了UNICODE标准。在软件开发中,特别是使用C语言的一些有关字符串处理的函数,ANSI和UNICODE是区分是用的,那么ANSI类型的字符和UNICODE类型的字符如何定义,如何使用呢?ANSI和UNICODE又如何转换呢?一.定义部分:ANSI: char str;可用字符串处理函数二.可用函数:ANSI:即 char, 可用字符串处理函数:strcat( ),strcpy( ), strlen( )等以str打头的函数。UNICODE:即wchar_t 可用字符串处理函数:wcscat(),wcscpy(),wcslen()等以wcs打头的函数。三.系统支持Windows 98 :只支持ANSI。Windows 2k :既支持ANSI又支持UNICODE。Windows CE :只支持UNICODE。说明1. 在COM里面只支持UNICODE。2. Windows 2000整个OS系统都是基于UNICODE的,为此在windows 2000下使用ANSI是需要付出代价的,虽然在编码上不用任何的转换,但是这种转化是隐藏的,是占用系统资源的(CPU,内存)。3. 在Windows 98下必须使用UNICODE,则需要自己手动的编码切换。三.如何区分:在我们软件开发中往往需要即支持ANSI又支持UNICODE,不可能在要求类型转换的时候,重新改变字符串的类型,和使用于字符串上的操作函数。为此, 标准的C 运行期库和Windows 提供了宏定义的方式。在C语言里面提供了 _UNICODE宏(有下划线),在Windows里面提供了UNICODE宏(无下划线),只要定了_UNICODE宏和UNICODE宏,系统就会自动切换到UNICODE版本,否则,系统按照ANSI的方式进行编译和运行。只定义了宏并不能实现自动的转换,他还需要一系列的字符定义支持。1. TCHAR如果定义了UNICODE宏则TCHAR被定义为wchar_t。typedef wchar_t TCHAR;否则TCHAR被定义为chartypedef char TCHAR;2. LPTSTR如果定义了UNICODE宏则LPTSTR被定义为LPWSTR。typedef LPTSTR LPWSTR;否则TCHAR被定义为chartypedef LPTSTR LPSTR;说明: 在使用字符串常量的时候需要使用_TEXT(“MyStr”)来支持系统的自动转换。
更多文章:
手机上怎么学电脑基础(最近对计算机网络技术比较感兴趣,想学点基础的内容,该怎么学)
2024年7月15日 07:59
execl怎么在格子里另起一行(Excel表格里怎样另起一行)
2024年6月30日 12:23
crc校验码计算器在线(超级CRC计算器HotCRC中的CRC出值碰撞有什么用途)
2024年7月12日 19:33
delphi win d(Delphi里如何让程序锁定在桌面上,win+d都无法最小化)
2024年7月10日 13:24
手机javascript下载(JavaScript的下载链接我怎样才能知道真正的地址)
2024年7月6日 10:05
medium height怎么读(medium height是什么意思)
2024年7月5日 09:17
indentation翻译(ball indentation hardness是什么意思)
2024年4月27日 19:00
automatical(有automatical这个单词么)
2023年10月8日 14:00
媒体查询的作用(自媒体胡编乱造新闻信息,影响大家对时局看法的问题该怎么解决)
2024年7月1日 00:36
软件编程控制程序(如何制作一个控制其他程序自动化运行的软件)
2024年7月3日 22:21
lenovoutility是什么软件(lenovo utility是否可以开机禁止)
2024年7月23日 14:36
怎么套用别人的网站(想做一个网页,别人说做网站最简单的办法就是套用别人网站的代码,但是具体怎么来做高手请指教)
2024年7月3日 09:40