[繁]格林童話變奏曲02	✡ 斗破蒼穹年番／鬥	[簡]單人房、日照一般
[繁]Re：Monster 04-	華為手機 AI讓女生一	[繁]魔法科高中的劣等

電腦新資訊	電腦軟體討論	電腦軟體資訊分享	電腦硬體討論	電腦硬體資訊分享	電腦萌化版	電腦系統 OS 討論	電腦程式設計
電腦設計技術交流	圖像設計及交流	各類下載工具教學	寬頻上網討論

返回列表

查看: 4324|回復: 1

[求助]Python只爬ptt內文，不要回覆(用BeautifulSoup)的方法?[複製鏈接]

jkl99

高級幼兒生(30/200)

Rank: 1

帖子: 10
積分: 106 點
潛水值: 4183 米

樓主

發表於 2017-9-16 11:13 PM|顯示全部樓層

成為伊莉的版主，你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛，那種滿足感等著你來嚐嚐喔。

只會一點點 Python 3 + google 拼拼湊湊的不知道這樣有沒有幫助

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
from lxml import html
import requests
def main():
# 網址
pageUrl = "https://www.ptt.cc/bbs/Stock/M.1504766085.A.C9B.html"
# 取得網址內容
rs = requests.session()
res = rs.get(pageUrl, stream=True, verify=True)
soup = BeautifulSoup(res.text, "lxml")
# 取得內文
mainContent = soup.find('div', {'id':'main-content'})
# 去除不要的標籤
for s in mainContent.find_all('div', {'class':'push'}, recursive=False):
s.decompose()
for s in mainContent.find_all('div', {'class':'article-metaline-right'}, recursive=False):
s.decompose()
for s in mainContent.find_all('span', {'class':'f2'}, recursive=False):
s.decompose()
for s in mainContent.find_all('div', {'class':'article-metaline'}, recursive=False):
s.decompose()
mainContent = BeautifulSoup(mainContent.decode_contents(formatter=None), "html.parser")
print(mainContent.prettify())
if __name__=='__main__':
main()

複製代碼

...

瀏覽完整內容，請先註冊或登入會員

成為伊莉的版主，你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛，那種滿足感等著你來嚐嚐喔。

使用道具檢舉

jkl99

高級幼兒生(30/200)

Rank: 1

帖子: 10
積分: 106 點
潛水值: 4183 米

頭香

發表於 2017-9-18 12:54 AM|顯示全部樓層

如果你覺得伊莉做得不錯，那就不要再猶疑了。今天就贊助和支持我們，立即行動！我們需要你的一點力量喔。

eyny0426 發表於 2017-9-17 12:20 AM
下載: 訪客無法瀏覽下載點，請先註冊或登入會員

感謝大大的幫忙
看您程式碼寫得簡潔有力又工整
應該是這方面的高手吧?

...

瀏覽完整內容，請先註冊或登入會員

回覆中加入附件並不會使你增加積分，請使用主題方式發佈附件。

使用道具檢舉

返回列表

Archiver|手機版|廣告|聯絡我們|廣告查詢|廠商合作|伊莉

GMT+8, 2024-5-4 08:56 PM

重要聲明：本討論區是以即時上載留言的方式運作，對所有留言的真實性、完整性及立場等，不負任何法律責任。而一切留言之言論只代表留言者個人意見，並非本網站之立場，用戶不應信賴內容，並應自行判斷內容之真實性。於有關情形下，用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。由於本討論區受到「即時上載留言」運作方式所規限，故不能完全監察所有留言，若讀者發現有留言出現問題，請聯絡我們。有權刪除任何留言及拒絕任何人士上載留言，同時亦有不刪除留言的權利。切勿上傳和撰寫侵犯版權(未經授權)、粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論，敬請自律。本網站保留一切法律權利。

		自動登錄	找回密碼或安全提問
密碼			註冊