标题:用python匹配中文网页,匹配结果为空的问题
取消只看楼主
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
结帖率:100%
已结贴  问题点数:0 回复次数:1 
用python匹配中文网页,匹配结果为空的问题
我想匹配http://www. 这个页面中的中间那段文字,结果我写了以下代码:

import httplib
import re
conn = httplib.HTTPConnection("www.)
conn.request("GET", "/cpdq/show.php?id=1000")
r1 = conn.getresponse()
data1 = r1.read()
keyword = (r'''<div class="f14" id="read_tpc">(.*?)</div>''',re.U)
a = re.findall(keyword,data1)
print a[0]
conn.close()

结果是a为空, 自然就没有a[0] 这个元素了。 但是我把网页源文件保存在文件里, 用读文件的方式去匹配, 却可以成功匹配,
请教下各位高手该怎么解决这个问题
搜索更多相关主题的帖子: 结果 中文 网页 python 
2010-04-01 13:56
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
得分:0 
回复 2楼 外部三电铃
想请您给我推荐一下,初学python该看什么书,我刚刚看了个PDF版本的《简明 Python 教程》 发现还是大大的不够
2010-04-01 14:24



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-301298-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 1.274223 second(s), 8 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved