水壶把手绳编法:关于VC控制台程序中英文字符处理的问题。请教!

来源:百度文库 编辑:杭州交通信息网 时间:2024/04/28 19:19:46
我是一位初学者,现在遇到一个问题很是困绕。我想从一个文本文件里读出每行(每行长度不固定),然后对拿到的字符串按固定长度进行分割,再根据分割后得到的字符串插入数据库。插数据库的问题,经过几天来对ODBC API的学习,感觉可以了,至少知道去看什么资料,我也做了些小小测试。但是对字符串的处理很困饶。

根据我的设想,肯定要对从文本文件里得到的每行字符串进行长度计算,但是VC默认的是宽字符MBCS,中文是2字节字符,strlen等函数都算出来的是单字节长度,比如“VCC程序”,打出来的长度是7,而我想得到5。如果定义字符串变量为WCHAR,用WCSLEN得到的是5,但是用PRINTF打印出来的是乱码。怎么解决这个问题呢?谁能给我一个例子,关于截中英文混合字符串按固定长度截取的控制台程序的代码范例。我现在是不知道用什么函数,不知道包含什么头文件。另外,想从基础做起,暂不用MFC。请大侠帮忙,不甚感谢!

用string类可以输出中英文混合的字符串啊。
string a="我a";
cout << a.c_str() << endl;

至于要得到长度,可以编一个函数来实现。该函数从字符串头部向后扫描,碰到小于128的,统计变量加1,碰到大于128的,则说明是中文,跳过下一个字符,统计变量加1。

在MSDN里有一章, 专门讲述窄字符与宽字符的"国际编程", 或许对你有帮助.

文章<有关UNICODE、ANSI字符集和相关字符串操作的总结>
http://blog.csdn.net/nicholasmaxwell/archive/2006/05/04/708417.aspx
也很有用