回复 9# dimo
你应该提供一个真实的样本以便测试
1楼那么长的描述,唯独不见样本。
那个空格是UTF-8编码中的一种空格,名称:Non-breaking space,编码:0xC2A0,与常规空格(\x20)不同。
cmd显示乱码不要紧,重定向到文件就行了。就看你会不会加重定向。
如果嫌显示实在是扎眼,可以这样:- @if(0)==(0) echo off
- cscript //nologo //e:jscript "%~f0"
- pause & exit
- @end
- function getText(file, charset){
- var ado = new ActiveXObject('ADODB.Stream');
- ado.Type = 2;
- ado.CharSet = charset;
- ado.Open();
- ado.LoadFromFile(file);
- var text = ado.ReadText(-1);
- ado.Close();
- return text;
- }
- var text = getText('Extract.out', 'utf-8');
- var html = new ActiveXObject('htmlfile');
- html.write(text);
- var s = html.getElementsByTagName('div')[0].innerText;
- WSH.Echo(s);
复制代码 |