<small id='NBmLtc'></small> <noframes id='OZAU'>

  • <tfoot id='0VNSR'></tfoot>

      <legend id='2y6kjb'><style id='u2gR'><dir id='DTOGeP3'><q id='4Hqfg76'></q></dir></style></legend>
      <i id='gkaSOtqhRf'><tr id='8PHBl'><dt id='Mw7LDY'><q id='ENuZ4bD'><span id='TVgUp7vEX'><b id='H2GNLCvu9'><form id='y7MSZ8'><ins id='wiblO'></ins><ul id='yGWAvBbN'></ul><sub id='s2Ni'></sub></form><legend id='AwFOlK'></legend><bdo id='mAPoRq8'><pre id='ON7UulvB8m'><center id='Fi3g1PL'></center></pre></bdo></b><th id='BUaYhFw'></th></span></q></dt></tr></i><div id='fyHpR6'><tfoot id='WSaKB'></tfoot><dl id='yLFj7VK'><fieldset id='FxeANGwbz'></fieldset></dl></div>

          <bdo id='TkNzo'></bdo><ul id='mN0B1FqID'></ul>

          1. <li id='xNRG0vbog'></li>
            登陆

            python爬取头条网页body源代码

            admin 2020-02-14 181人围观 ,发现0个评论

            代码如下:

            #本代码作用是:在头条里进行关键字查找,并打印查找页面的源代码
            #1、首要导入相应的模块
            import requests
            from bs4 imppython爬取头条网页body源代码ort BeautifulSoup
            #2、界说函数:设置恳求网址并设置恳求头,对网站进行解析
            def spider1(kw):
            url1="https://www.toutiao.com/search/?keyword=" #设置网站的前半部分为头条的查找页面
            url=upython爬取头条网页body源代码rl1python爬取头条网页body源代码+kw #设置网站为头条的查找页面+关键字
            headers={"User-Agent":"Mozilla/5.0 (Windowspython爬取头条网页body源代码 NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gepython爬取头条网页body源代码cko) Chrome/69.0.3497.100 Safari/537.36"} #设置恳求头
            response=requests.get(url,headers=headers) #对网站进行get恳求,并伪装成浏览器进行恳求
            response.encoding="utf-8" #设置网页的编码为utf-8
            html=response.text #将网页恳求的源代码赋值给html
            soup=BeautifulSoup(html,"lxml")
            print(soup.findAll("body")) #读取网页的body代码
            #3、对函数进行调用,即打印依据关键字进行查询后的源代码
            spider1("python") #调用当参数是python时的spider1函数

            运转成果如下图所陈贵贞示:

            请关注微信公众号
            微信二维码
            不容错过
            Powered By Z-BlogPHP