色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python爬取鏈家二手房的數據

瀏覽:30日期:2022-06-18 17:08:08
目錄一、查找數據所在位置:二、確定數據存放位置:三、獲取html數據:四、解析html,提取有用數據:一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python爬取鏈家二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python爬取鏈家二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息url = ’https://nj.lianjia.com/ershoufang/pg{}/’.format(page)# 請求urlresp = requests.get(url, headers=headers, timeout=10)四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, ’lxml’)# 篩選全部的li標簽sellListContent = soup.select(’.sellListContent li.LOGCLICKDATA’)# 循環遍歷for sell in sellListContent: # 標題 title = sell.select(’div.title a’)[0].string # 先抓取全部的div信息,再針對每一條進行提取 houseInfo = list(sell.select(’div.houseInfo’)[0].stripped_strings) # 樓盤名字 loupan = houseInfo[0] # 對樓盤的信息進行分割 info = houseInfo[0].split(’|’) # 房子類型 house_type = info[1].strip() # 面積大小 area = info[2].strip() # 房間朝向 toward = info[3].strip() # 裝修類型 renovation = info[4].strip() # 房屋地址 positionInfo = ’’.join(list(sell.select(’div.positionInfo’)[0].stripped_strings)) # 房屋總價 totalPrice = ’’.join(list(sell.select(’div.totalPrice’)[0].stripped_strings)) # 房屋單價 unitPrice = list(sell.select(’div.unitPrice’)[0].stripped_strings)[0]

以上就是我的分享,如果有什么不足之處請指出,多交流,謝謝!

以上就是python爬取鏈家二手房的數據的詳細內容,更多關于python爬取鏈家二手房的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 国产不卡在线播放 | 国产片在线观看狂喷潮bt天堂 | 性欧美欧美巨大69 | 欧美日韩 国产区 在线观看 | 在线免费观看色 | 久久免费成人 | 97国产在线播放 | 国产精品久久久久一区二区三区 | 欧美一级欧美三级在线 | 4438全国最大成人网视频 | 日本高清不卡在线观看 | 1717she国产精品免费视频 | 国模肉肉人体大尺度啪啪 | 毛片96视频免费观看 | 夜色毛片永久免费 | 91亚洲人成手机在线观看 | 中日毛片| 日韩欧美国产视频 | 久久免费精彩视频 | 福利片免费一区二区三区 | 最新国产精品自拍 | 免费网站看v片在线香蕉 | 国产免费一区二区在线看 | 在线亚洲精品国产成人二区 | 久久精品无遮挡一级毛片 | 中文字幕一区二区三区在线观看 | 久久精品高清视频 | 亚洲精品欧美 | 国产一区二区三区精品视频 | 成年视频国产免费观看 | 欧美日韩免费一区二区三区 | 国产99视频在线观看 | 国产99视频精品免费观看7 | 一区二区三区中文国产亚洲 | 青青热在线精品视频免费 | 国内精品久久久久影院不卡 | 国产精品三级手机在线观看 | aaa毛片在线| 免费在线观看黄色毛片 | 国产99视频免费精品是看6 | 极品精品国产超清自在线观看 |