PyPDF2如果裝的是3.0版本,注意讀取頁(yè)碼數(shù)量的numPages的函數(shù)已經(jīng)被刪除了,要用len(pdfreader.Pages)代替
學(xué)習(xí)達(dá)人
|
zqlong02
展開(kāi)
|
學(xué)習(xí)達(dá)人
|
crwyzxw
展開(kāi)
|
twinkle13
展開(kāi)
|
|
打卡Lv2
|
A303299241
展開(kāi)
PyPDF2新版本好多函數(shù)都不能用了呀。費(fèi)了半天勁。
import PyPDF2
def extract_text_from_pdf(pdf_path):
with open(pdf_path, 'rb') as file:
reader = PyPDF2.PdfReader(file)
text = ''
for page_num in range(len(reader.pages)):
page = reader.pages[page_num]
text += page.extract_text()
return text |
學(xué)習(xí)標(biāo)兵
|
xiadachen
展開(kāi)
|
yan_jack
展開(kāi)
|
承擔(dān)因您的行為而導(dǎo)致的法律責(zé)任,
本站有權(quán)保留或刪除有爭(zhēng)議評(píng)論。
參與本評(píng)論即表明您已經(jīng)閱讀并接受
上述條款。