LearnCrawlWebsite

Nó chỉ để cào 1 trang web hocvalamtheobac.vn

Hướng dẫn dùng

  • Tạo file tên người dùng và mật khẩu xen kẽ lẫn nhau rồi lưu dưới dạng 1 file .txt
  • Copy đường dẫn của file vừa tạo và Paste vào file config.txt
  • Copy đường dẫn file chromedriver.exe trong thư mục project sau đó Paset vào file config.txt

Lưu Ý

  • Bạn phải đặt tên thư mục và đường dẫn đều phải là English :)) nghĩa đen. Nếu bạn muốn thử cứ đặt Vietnamese thử đi mình chưa thử lỗi mình không biết :v
  • Cài đặt sãn Python trong máy
  • Cài thêm các thư viện

XlsxWriter 3.0.2

pip install XlsxWriter

beautifulsoup4 4.10.0

pip install BeautifulSoup

chromedriver 2.24.1

pip install chromedriver

lxml 4.6.4

pip install lxml

python-time 0.3.0

pip install python-time

requests 2.26.0

pip install requests

selenium 3.141.0

pip install selenium

webbot 0.34

pip install webbot

GitHub

View Github