99热99这里只有精品6国产,亚洲中文字幕在线天天更新,在线观看亚洲精品国产福利片 ,久久久久综合网

歡迎加入QQ討論群258996829
麥子學(xué)院 頭像
蘋果6袋
6
麥子學(xué)院

Python并發(fā)庫gevent的使用 

發(fā)布時(shí)間:2017-02-18 13:42  回復(fù):0  查看:3391   最后回復(fù):2017-02-18 13:42  

我們知道對(duì)于網(wǎng)絡(luò)請(qǐng)求這種IO bound的場(chǎng)景來說,最怕的就是某個(gè)請(qǐng)求阻塞了其余的操作,讓并發(fā)性大大降低。今天就來介紹一款python開發(fā)的并發(fā)庫gevent 

  首先看一下他自己的介紹:

  gevent是一個(gè)基于libev的并發(fā)庫。它為各種并發(fā)和網(wǎng)絡(luò)相關(guān)的任務(wù)提供了整潔的API

  嗯,確實(shí)很簡(jiǎn)潔,很易使用。待會(huì)我們就見識(shí)到了。

  同步IO

  首先我們來看看傳統(tǒng)的IO請(qǐng)求。

  比如我們請(qǐng)求: http://httpbin.org/ip 發(fā)個(gè)http get請(qǐng)求會(huì)得到我們的ip地址,如:

  {

  "origin": "183.240.202.14"

  }

  我們來寫個(gè)腳本連續(xù)發(fā)50個(gè)get請(qǐng)求到這個(gè)地址,以模擬多個(gè)請(qǐng)求。(腳本命名為get.py)

  import requests

  url = 'http://httpbin.org/ip'

  for i in range(50):

  print("{}: {}".format(i, requests.get(url).text))

  統(tǒng)計(jì)一下運(yùn)行時(shí)間:

  $ time python3 get.py

  (輸出略...)python3 get.py 0.56s user 0.06s system 1% cpu 35.606 total

  大概花費(fèi)35s鐘,當(dāng)然不同網(wǎng)絡(luò)環(huán)境可能結(jié)果不同。而且打印出來的結(jié)果是按照1, 2, 3...50這樣的順序來的,說明整個(gè)請(qǐng)求是同步的,一個(gè)請(qǐng)求結(jié)束再發(fā)下一個(gè)請(qǐng)求。

  使用gevent

  我們?cè)賮韺懸粋€(gè)gevent版的get.py,命名為gevent_get.py

  import requestsimport geventimport gevent.monkey# 這里將socket變成異步

  gevent.monkey.patch_socket()

  url = 'http://httpbin.org/ip'

  def hello(i):

  print("{}: {}".format(i, requests.get(url).text))

  tasks = [gevent.spawn(hello, i) for i in range(50)]

  gevent.joinall(tasks)

  再來看看運(yùn)行時(shí)間:

  $ time python3 gevent_get.py

  (輸出略...)python3 gevent_get.py 0.49s user 0.06s system 39% cpu 1.403 total

  我的天!才1.4秒左右,而且打印出來的結(jié)果沒有按照1, 2, 3...50這樣排列,而是按照隨機(jī)順序排列的,說明整個(gè)請(qǐng)求是異步非阻塞的。

  結(jié)論

  我又多試了幾次,gevent的效率確實(shí)牛,遠(yuǎn)遠(yuǎn)高于同步io請(qǐng)求。最近在我的一個(gè)爬蟲小項(xiàng)目里面用進(jìn)程池 + gevent,爬取80個(gè)頁面,大概花費(fèi)40s左右,每個(gè)頁面只要0.5s,而且還包括DOM解析的時(shí)間,而用同步請(qǐng)求則花費(fèi)大概300s左右。

gevent的更多用法請(qǐng)參考其官方文檔。這么簡(jiǎn)單又好用的庫趕緊試試吧。


來源:SegmentFault

您還未登錄,請(qǐng)先登錄

熱門帖子

最新帖子

?