convert-html-to-pdf

Repositório de tutorial para uso de Web Scraping e pdfkit para transformar livros em pdf usando Python com o site gutenberg.org

Requirements

você pode instalar as bibliotecas com este comando:

pip install -r requirements.txt

Executar

python -u main.py | python3 -u main.py

É possível fazer o scraping de quase qualquer livro do site só mudando a URL do livro no arquivo main.py

Documentações e Referências

requests

Repositório no GitHub - https://github.com/psf/requests
Documentação Oficial - https://requests.readthedocs.io/en/latest/
biblioteca no PyPI - https://pypi.org/project/requests/

bs4

Repositório no launchpad - https://code.launchpad.net/beautifulsoup
Documentação Oficial em Português - https://www.crummy.com/software/BeautifulSoup/bs4/doc.ptbr/
biblioteca no PyPI - https://pypi.org/project/beautifulsoup4/
tutorial no medium - https://medium.com/horadecodar/como-fazer-webscraping-com-python-e-beautiful-soup-28a65eee2efd

pdfkit

Repositório no Github - https://github.com/JazzCore/python-pdfkit
biblioteca no PyPI - https://pypi.org/project/pdfkit/
tutoriais no medium:
https://towardsdatascience.com/how-to-easily-create-a-pdf-file-with-python-in-3-steps-a70faaf5bed5
https://medium.com/@techsolutionstuff/how-to-convert-html-to-pdf-in-python-f4744c22096c

WKHTMLTOPDF

Repositório no GitHub - https://github.com/wkhtmltopdf/wkhtmltopdf
Documentação Oficial - https://wkhtmltopdf.org/docs.html

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
core		core
template		template
tests		tests
.gitignore		.gitignore
Adaptando livros web para pdf com web scraping e pdfkit.pdf		Adaptando livros web para pdf com web scraping e pdfkit.pdf
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

convert-html-to-pdf

Requirements

Executar

Documentações e Referências

requests

bs4

pdfkit

WKHTMLTOPDF

About

Releases

Packages

Languages

License

gabriel-batistuta/convert-html-to-pdf

Folders and files

Latest commit

History

Repository files navigation

convert-html-to-pdf

Requirements

Executar

Documentações e Referências

requests

bs4

pdfkit

WKHTMLTOPDF

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages