asp抓取utf-8网页乱码的解决方法及修改编码
以前写了一个asp的小偷程序,这个只能抓取gbk的网页:
asp抓取指定网页内容小偷采集程序改进版
但是现在大部分的网站是utf-8 的编码格式,这就需要更改asp文件的编码方式。
更改方式如下:
1 2 3 | < %@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> < %Session.CodePage=65001%> < %Response.charset = "utf-8"%> |
然后更改下程序的编码方式:
1 | getHTTPPage=BytesToBstr(t,"utf-8") |
其实上面的三句代码就是更改asp的默认编码的代码。
Asp中文件操作FSO组件的用法详解 Asp中RegExp对象的方法和属性详解