字體:小 中 大 | |
|
|
2017/07/31 00:20:41瀏覽63|回應0|推薦0 | |
香醇優格自己做,綿柔口感好營養-家酪優優格機我平時很喜歡在momo購物摩天商城上面買鞋子和各類包包,對我來說,包和鞋子的細節反映了一個女生對於自己生活的評價和看法。因此在選擇的時候,不單單是要物盡所需,更要緊跟潮流。不同類型的包包襯托出來的氣質也是不一樣的。像我算是比極高的人,所以我一般在momo購物摩天商城上面選擇 【GG&L】PATCHMAKER圍巾(混米色印花) 。 當然了,在選擇包包的時候,我還很關注包的材料。一般我會選擇比較大的 【GG&L】PATCHMAKER圍巾(混米色印花) ,這類的包包一般都是用真皮或者是拼圖的仿皮製作而成的。而這類包包的形狀和肩線跟我們常見的旅行包是比較像的。 【GG&L】PATCHMAKER圍巾(混米色印花) 很多包都是這種類型的,比較適合像我一樣高的妹子。我是做行政工作的,平時會有比較多的文件,這類大包包也能夠讓我帶比較多的文件。 現在我背著在momo購物摩天商城上購買的 【GG&L】PATCHMAKER圍巾(混米色印花) 去上班,已經成為了全公司時尚的焦點。當然了除了前面說的大包包,挎包也是我比較喜歡的一種類型。長帶挎包是一種比較常見的包,將帶子放到最長的位置,斜挎在身上,還能夠掩蓋臀部的缺陷。如果你也喜歡各式各樣的寶寶,就去momo上面看看吧。 來自:葉孤城___ - 簡書作者:葉孤城___https://github.com/zangqilong198812鏈接:http://www.jianshu.com/p/b87413a9307e寫網絡爬蟲,除瞭c/c++,第二門語言最好的選擇就是python.原因就是1.語法簡單2.庫太多,隨便想要什麼功能的庫都找得到,簡直編程界的哆啦A夢.3.語法優美,不信?你去看看python超過兩千行的代碼再回頭看看用oc寫的超過兩千行的代碼,oc寫的簡直醜到極致(沒命名空間,點語法調用和括號調用混用).為什麼要會寫爬蟲?春節前有一件活無人認領,我就自告奮勇認領瞭,具體如下:自己寫程序在豆瓣讀書上抓取人熊節覺得一個好的程序員應該讀過那20本好書 ——《重構》《精益創業》《敏捷軟件開發》《測試驅動開發》等等。他在為ThoughtWorks組建成都分公司團隊的時候,發愁正統招聘方法太慢瞭。於是,他花瞭幾個晚上用自己高中自學的水貨代碼水平寫瞭一個程序,去抓取豆瓣上讀過這些技術書籍的人。然後不斷遞歸,再抓到這些人都讀過其它什麼書,再繼續抓讀過那些書的人。抓瞭幾萬人之後,他再用Hadoop來分析,篩選出瞭幾十個技術大牛。他把這些大牛的豆瓣賬號扔給瞭公司女HR,讓HR去一個個發豆郵勾搭。春節期間斷斷續續邊看邊學寫瞭個爬豆瓣上優秀iOS開發人員的爬蟲.所以感覺iOS開發人員有必要掌握這項技術.再舉個例子,你如果想自己弄個app,例如每日精選美女之類的app,你服務端總得有圖吧,怎麼弄?自己用爬蟲爬啊,爬到鏈接瞭塞到數據庫裡,傳個json,app直接sdwebimage就好瞭.多爽!廢話不多說.開始寫.我先假設你用的是mac,然後mac都預裝瞭python2.x,然後呢,你有瞭python沒用,你得有庫.沒庫怎麼幹活?怎麼安裝庫呢?python界也有個類似於我們iOS開發裡cocoapods的東西,這個東西叫做pip.pip和cocoapods用起來的命令都極其類似,我們隻需要兩個庫,一個叫做urllib2,一個叫做beautifulsoup.urllib2是幹什麼的呢?它的作用就是把網頁down下來,然後你就可以分析網頁瞭.beautifulsoup幹什麼的呢?你用urllib2把網頁down下來瞭之後,裡面都是html+css什麼的,你想要從亂七八糟的一堆html裡面找到正確的圖片鏈接那可不是件簡單的事,據我這幾天的學習,做法無非兩個,一個是自己寫正則表達式然後用一個叫re的python庫,另一個是使用lxml解析xpath.這兩個說實話都不太好用,一個正則就夠你吃一壺的.後來我搜索瞭很久,發現瞭一個庫叫做beautifulsoup,用這個庫解析html超級好用.然後你們打開terminal敲入下面這個命令.pip install BeautifulSoup然後就會自動幫你安裝BeautifulSoup這個東西瞭.urllib2因為是自帶的,所以不用你下載瞭.好的我們打www.dbmeizi.com,這個邪惡的網站,首頁都是軟妹子.直接右鍵打開源文件.你看到的是這些東西.看上去和亂碼沒什麼區別,但是我們需要仔細觀察.終於找到瞭圖片的鏈接.圖片鏈接就在li這個標簽下地img標簽裡.現在我們需要做的就是嘗試著把這種類型的li從所有html中分離出來.我們可以看到li這個標簽有個屬性叫做class,這個屬性的值是 >搜索一下,我們發現有20個結果.恰巧,我們這個頁面的圖片也隻有20個,那麼可以確定的是我們找到瞭區別於其他標簽的唯一性.再仔細分析下,img這個標簽在li這個標簽裡有且隻有一個.那麼,也就是說,我們先搜索出所有符合條件的li標簽,然後找到裡面的img標簽就可以找到所有的圖片鏈接瞭.然後看代碼.#!/usr/bin/python#-*- coding: utf-8 -*-#encoding=utf-8import urllib2import urllibimport osfrom BeautifulSoup import BeautifulSoupdef getAllImageLink():html = urllib2.urlopen( http://www.dbmeizi.com ).read()soup = BeautifulSoup(html)liResult = soup.findAll( li ,attrs={ class : span3 })for li in liResult:imageEntityArray = li.findAll( img )for image in imageEntityArray: link = image.get( data-src ) imageName = image.get( data-id ) filesavepath = /Users/weihua0618/Desktop/meizipicture/%s.jpg % imageName urllib.urlretrieve(link,filesavepath) print filesavepathif __name__ == __main__ :getAllImageLink()我們來一句一句分析下.其實python的語法超級簡單.凡是#打頭的就是python裡面的註釋語句類似於oc裡的//.分別說明我們的環境是python,編碼是utf-8然後import瞭四個庫,分別是urllib2,urllib,os,和beautifulsoup庫.導入beautifulsoup庫的方式和其他三個不太一樣.我暫時也不清楚為什麼python用這種導入方式,不過照貓畫虎就行瞭.然後def打頭的就是定義一個函數,python裡面是不用分號做句與句的分隔符的.他用縮進來表示.與def縮進一個tab的都是函數體.html = urllib2.urlopen( http://www.dbmeizi.com ).read()這句很簡單,就是讀取網頁的html.然後把值賦給html這個變量.python裡聲明變量前面不用加任何東西,不用加聲明語句和變量類型,就連javascript聲明變量還要加個var呢.我們獲取瞭網頁的html之後呢,聲明瞭一個beautifulsoup變量soup,用來準備解析html.liResult = soup.findAll( li ,attrs={ class : span3 })這句話的意思就是,尋找html中所有li標簽,並且這個li標簽有個屬性class,class的值是span3.註意這個findAll函數,有點常識的話你應該清楚,凡是帶all的函數基本上返回的都是一個數組,所以我們liResult這個變量實際上是一個數組.for li in liResult:這句話基本和oc裡的遍歷數組語法完全一樣.就是遍歷liResult裡的每一個變量.那麼每一個變量就是一個\●標簽.imageEntityArray = li.findAll( img )獲得瞭li標簽,我們再找出所有的img標簽.一樣的道理,遍歷所有img標簽(實際上隻有一個).link = image.get( data-src )imageName = image.get( data-id )這兩句的意思就是,獲取img標簽裡的 data-src 屬性和 data-id 屬性,data-src就是我們最想要的圖片鏈接瞭.data-id我們會用來當做下載圖片之後的名字.filesavepath = /Users/weihua0618/Desktop/meizipicture/%s.jpg % imageNameurllib.urlretrieve(link,filesavepath)這兩句,第一句是設置一個文件存放地址,第二句用urllib這個庫的urlretrieve這個方法下載我們的圖片,並且把圖片放到剛才的路徑裡.好瞭,我們的圖片就下載完瞭.說說我是怎麼爬蟲所有豆瓣ios開發的,我先找到所有標簽為ios開發的書籍,然後把所有書的id抓到,然後用id找到所有閱讀過書的用戶id,把所有用戶id抓下來之後用hadoop分析,哪些用戶id讀過的書最多,列出前一百個.然後,你們懂得...(昨天我的ip還是mac地址已經被豆瓣封瞭)我感覺,我可以在簡歷上鄭重的寫下 精通python和大數據分析 -_-!來自:葉孤城___ - 簡書作者:葉孤城___https://github.com/zangqilong198812鏈接:http://www.jianshu.com/p/b87413a9307e薦號:IT創業網互聯網創業的時代,創業更具人文氣息。聚最經典的IT創業技巧,最頂尖的商界精英交流平臺。微信微信號:chuangyetech↑↑↑長摁二維碼試試●本文編號835,以後想閱讀這篇文章直接輸入835即可。●本文分類“Python”、“搜索引擎技術”,搜索分類名可以獲得相關文章。●輸入m可以獲取到全部文章目錄●輸入r可以獲取到熱門文章推薦●輸入f可以獲取到全部分類名稱 不忍直視,妹子的便宜就這麼被占瞭! 我是主播 貝妮~(微信號:Voaoao)每天提供最熱門、最火爆、最精彩的視頻!口味有點兒重喔~笑死!笑死!笑死!如果覺得這些還... 飛機上你所不知道的25個真相! 現如今,飛機以舒適、方便與節省時間等原因成為出行首選的交通方式之一.可你是否知道,為何不能喝飛機上的沖泡茶飲,又為何在... 這樣霸氣的速寫,隻有他能畫的出來!~ 感知CG,感觸創意,感受藝術,感悟心靈 在CG世界的一期中我們展示瞭 Vince Low的一部分作品,今天再次翻看CG網站時發現他的... 商品訊息簡述: 型號:245926130026 商品訊息功能:
|
|
( 在地生活|大台北 ) |