以前我曾经贴过一篇用XMLHTTP Post Form 的帖子,那里的代码中我Post E文的Value毫无问题,但是后来发现Post含有中文的表单时会出现乱码,原因当然是UTF-8 和GB2312 之间的转换问题了!TNND,打倒GB2312!大家都用UTF8多好。
用XMLHTTP Post Form时的表单乱码有两方面的原因——Post表单数据时中文乱码;服务器Response被XMLHTTP不正确编码引起的乱码。换句话说,本文主要解决两个问题——怎样正确Post中文内容%26amp;怎样正确显示得到的中文内容。
Part I Post中文内容
先看看E文的表单是怎么提交的
%26lt;SCRIPT language=%26quot;JavaScript%26quot;%26gt;
strA = %26quot;submit1=Submit%26amp;text1=scsdfsd%26quot;;
var oReq = new ActiveXObject(%26quot;MSXML2.XMLHTTP%26quot;);
oReq.open(%26quot;POST%26quot;,%26quot;http://ServerName/VDir/TstResult.asp%26quot;,false);
oReq.setRequestHeader(%26quot;Content-Length%26quot;,strA.length);
oReq.setRequestHeader(%26quot;CONTENT-TYPE%26quot;,%26quot;application/x-www-form-urlencoded%26quot;);
oReq.send(strA);
%26lt;/ScRIPT%26gt;
假如把strA = %26quot;submit1=Submit%26amp;text1=scsdfsd%26quot;;换成
strA = %26quot;submit1=Submit%26amp;text1=中文%26quot;;
你会发现提交上去的东东根本不对,ASP中Request.Form(%26quot;Text1%26quot;)根本取不到值。俺用Request.BinaryRead把一个HTML Form中的Post内容写出来看了看,才发现问题——Form提交时也要编码的,编码后的中文是类似于%??%??的转义字符,比如“中文”就被编码为%D6%D0%CE%C4。呵呵,也怪俺笨,人家CONTENT-TYPE里明明写的清清楚楚——application/x-www-form-urlencoded,urlencoded嘛当然就是这个样子了。既然这样,那我们也知道该怎么办了——自己做转换,代码见下
%26lt;SCRIPT language=%26quot;VBScript%26quot;%26gt;
Function URLEncoding(vstrIn)
strReturn = %26quot;%26quot;
For i = 1 To Len(vstrIn)
ThisChr = Mid(vStrIn,i,1)
If Abs(Asc(ThisChr)) %26lt; %26amp;HFF Then
strReturn = strReturn %26amp; ThisChr
Else
innerCode = Asc(ThisChr)
If innerCode %26lt; 0 Then
innerCode = innerCode + %26amp;H10000
End If
Hight8 = (innerCodeAnd %26amp;HFF00)\ %26amp;HFF
Low8 = innerCode And %26amp;HFF
strReturn = strReturn %26amp; %26quot;%%26quot; %26amp; Hex(Hight8) %26amp;%26quot;%%26quot; %26amp; Hex(Low8)
End If
Next
URLEncoding = strReturn
End Function
strA = URLEncoding(%26quot;submit1=Submit%26amp;text1=中文%26quot;)
oReq = CreateObject(%26quot;MSXML2.XMLHTTP%26quot;)
oReq.open %26quot;POST%26quot;,%26quot;http://ServerName/VDir/TstResult.asp%26quot;,false
oReq.setRequestHeader %26quot;Content-Length%26quot;,Len(strA)
oReq.setRequestHeader %26quot;CONTENT-TYPE%26quot;,%26quot;application/x-www-form-urlencoded%26quot;
oReq.send strA
%26lt;/ScRIPT%26gt;
(在这里俺把前面的JavaScript的代码改成了VBScript,不是吃饱了撑的没事干,原因见后)
Part II.正确显示得到的中文内容
OK,假如你在Server端把Form的内容写到数据库/文件的话,你在那里看到的中文毫无问题,但是,假如你想看看Server的Response——问题来了假如Response的结果不是XML,XMLHTTP.responseXML里当然是不会有东东的,那就用responseText好了,在代码的最后加一句
alert(oReq.responseText)
看看俺们辛勤劳动的结果:P
但是但是.....怎么所有的中文全变成了方格? (我打不出来,有爱好自己去试,也不用Post,Get一个含有中文的网页就可以发现了。)
原因很简单XMLHTTP得到Response时假定Response是UTF8编码的,假如Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼!
不过好在还有补救的办法XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——%26quot;a raw undecoded bytes as received directly from the server%26quot; ),唯一的问题是,responseBody返回的是一个unsigned bytes数组,我们怎么去访问它,怎么把它转换成BSTR?
这就是为什么我在上面把代码改成VBScript的原因——VBScript Can do it,but JavaScript Cannot!
代码见下
%26lt;SCRIPT language=%26quot;VBScript%26quot;%26gt;
Function URLEncoding(vstrIn)
strReturn = %26quot;%26quot;
For i = 1 To Len(vstrIn)
ThisChr = Mid(vStrIn,i,1)
If Abs(Asc(ThisChr)) %26lt; %26amp;HFF Then
strReturn = strReturn %26amp; ThisChr
Else
innerCode = Asc(ThisChr)
If innerCode %26lt; 0 Then
innerCode = innerCode + %26amp;H10000
End If
Hight8 = (innerCodeAnd %26amp;HFF00)\ %26amp;HFF
Low8 = innerCode And %26amp;HFF
strReturn = strReturn %26amp; %26quot;%%26quot; %26amp; Hex(Hight8) %26amp;%26quot;%%26quot; %26amp; Hex(Low8)
End If
Next
URLEncoding = strReturn
End Function
Function bytes2BSTR(vIn)
strReturn = %26quot;%26quot;
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode %26lt; %26amp;H80 Then
strReturn = strReturn %26amp; Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn %26amp; Chr(CLng(ThisCharCode) * %26amp;H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function
strA = URLEncoding(%26quot;submit1=Submit%26amp;text1=中文%26quot;)
oReq = CreateObject(%26quot;MSXML2.XMLHTTP%26quot;)
oReq.open %26quot;POST%26quot;,%26quot;http://ServerName/VDir/TstResult.asp%26quot;,false
oReq.setRequestHeader %26quot;Content-Length%26quot;,Len(strA)
oReq.setRequestHeader %26quot;CONTENT-TYPE%26quot;,%26quot;application/x-www-form-urlencoded%26quot;
oReq.send strA
alert bytes2BSTR(oReq.responseBody)
%26lt;/ScRIPT%26gt;
嘿嘿,是不是很简单啊,用这个再试试看?一切OK!
(顺便说说byte(),这个东东在VBScript里的表现只能用妖来形容——对它调用VarType 返回8209——vbArray + vbByte,用LBound、UBound能拿到数组的上界下界,但是就是不能用name(i)的形式访问,搞得我以为在Script里根本没法处理这种类型,在bytes2BSTR函数里可以看到我是把它当成String来处理的——LenB/MidB什么的,发现这点纯属意外——我开始往这个函数里传的是XMLHTTP.responseText,想一个Byte一个Byte地看看里面到底有点什么,后来一时性起把responseText改成responseBody,结果就中奖了,哈哈)
最后的废话
1、以上代码在MSXML Parser 3 Release+VBScript 5.5环境下通过。那位兄弟有早一点版本的Script可以帮我试试看能不能成。
2、一直以为JavaScript vs VBScript应该是JavaScript略好,所以有时候想彻底抛弃VBScript,ASP Server/Client统统用JavaScript,看来未必是个好主意。
用XMLHTTP Post/Get HTML页面时的中文乱码之完全Script解决方案
2002-11-07 10:35:42 作者
相关文章
- · 如何获取本地HTML文件的标题,超级链接
- · 直接访问WebBrowser控件中的HTML源码
- · html小技巧
- · 用CB制作具有HTML风格的动态按钮
- · 用C++制作有HTML风格的动态按钮
- · 使用Java将Word转为Html或txt!
- · use itext to create a html
- · javamail 处理html信件的方法,包括发送html和接受html邮件
- · bean里面如何打印到html页面
- · Acme包中的以Post方式发送数据的例子
- · 从HTML到XML
- · xmlhttp和Java session监听改善消息系统
- · WEB中基于XMLHTTP的简单实例分析(图)
- · 新手入门之浅谈XML和HTML的关系
- · 使用 Struts 提供的 HTML 标签库
- · Struts 中 html:options 的使用
- · 如何使用Lucene对html文件进行索引
- · html-Cancel标签应用注意事项篇
- · 再谈通过 Java 执行 POST 操作
- · 用Java编写HTML文件分析程序
- · java2html_src_0.8alpha源代码发布版(在线源代码生成器)
