python爬新闻-白红宇

python爬新闻

阅读量：6885 次

发布时间：2019-06-27

本文共 875 字，大约阅读时间需要 2 分钟。

import refrom urllib import requestfrom lxml import etreetesturl="http://news.163.com/rank/"with request.urlopen(testurl) as f:    print('Status:', f.status, f.reason)    #网页的编码格式只取一次，默认所有的编码方式都是这个    decode=(f.headers['Content-Type'].split(';')[1]).split('=')[1]    data = f.read().decode(decode.lower())    infos = re.findall(r'
    
     (.*?)
     
      .*?
     
    
', data, re.S)    for i in range(len(infos)):        print('%s-%s'%(i,infos[i][0]))    print('选择新闻类型')    k=input()    if k.isdigit()and int(k)
    
     .*?',data,re.S)            newdom=etree.HTML(new)            newitems=newdom.xpath("//div[@id='endText'and @class='post_text']/p/text()")            for n in newitems:                print(n)            print('=======================输入y继续')            if 'y'==input():continue            else:break;

转载于:https://www.cnblogs.com/zhisy/p/6832295.html

你可能感兴趣的文章

机器学习入门之二：一个故事说明什么是机器学习（转载）

查看>>