Skip to content

ghLcd9dG/Selenium-Document

Repository files navigation

本书读者对象

  • 测试自动化
  • Web开发者
  • Python开发工程师
  • 人工智能工程师
  • 爬虫开发工程师
  • 数据分析工程师
  • 系统运维工程师

本书内容及体系结构

第1章 从Selenium开始

本章从起初入手,帮助读者了解Selenium项目的框架和由来,以及如何选择自己的WebDriver。接着介绍了在Windows和Linux两种操作系统下的Selenium安装方式。

第2章 页面导航

本章对Selenium项目和浏览器交互的基本操作内容进行了介绍和串讲。本章介绍了如何通过Selenium项目实现启动浏览器,打开浏览器,浏览器窗口切换等一系列的常用的浏览器操作的自动化。

第3章 元素定位

在第三章中笔者将会引领读者领略了Selenium的八种元素定位方式。通过对本章与前两章的内容的学习,读者可以初步掌握并实现一个略有雏形的自动化程序的能力。

第4章 利器----PhantomJS

PhantomJS是一个独立的项目,可以实现绝大部分浏览器的功能。不同于其他的浏览器,PhantomJS只会在内存中运行,而不会显示任何界面。十分适合我们进行数据采集的时候使用。本章介绍了PhantomJS和 Selenium搭配使用的方法。

第5章 实战part1——Python官网

本章是对前面所学的内容的一个综合整理运用。通过实战,帮助读者巩固已经学习过的知识,并且在实际操作中,锻炼读者的编程能力与思维。

第6章 实战part2——今日头条

以今日头条为例子,引入即将要学习的内容,本章主要讨论技术部分实现以及解决思路分析。目的在于帮助读者形成一个目录式的系统印象。

第7章 数据编解码、处理

在互联网中,难免要面对错综复杂的各种数据类型,这一章主要介绍以下内容:CSV、JSON、XML、BASE64、NLTK、HASH、Bloom Filter以及关系型数据库和非关系型数据库。

第8章 实战part3——猫眼电影

以猫眼电影为例子,详细讲解从了解客户需求到网站分析、处理的全套流程,并在分析中逐步引入代码的说明与实现。

第9章 实战part4——淘宝商品

在这一小节中,笔者以淘宝商品为例子,阐述如何应对复杂网站的页面数据采集,帮助诸位追赶较为新颖的实现方式,解决读者因难以下手而犹豫不决,无法直接应用的难题。

第10章 单元测试

解决单元测试是什么、为什么要写单元测试、应该怎么写单元测试这三个难题。帮助读者评估在自己的项目中是否要使用单元测试。

第11章 多线程

实现同步完成多项任务的功能,帮助读者提高程序的运行效率,解决时间。讨论线程、进程、线程切换、锁以及GIL等概念。

第12章 发送邮件

本章讨论程序反馈最低廉且合理的方式,通过实现自动化发送邮件,实现服务器(程序)无人值守情况下的报备以及记录

第13章 Selenium IDE

介绍了两个简单且方便的录制自动化脚本的工具,为读者提供一条功能化的测试道路,快捷生成自动化脚本。

第14章 Python拓展

这一章节讨论包括但不限于:Python2代码转换Python3代码,测试类型,通配符,字符串方法,异常层次结构,类,推导式等等扩展性内容。

第15章 GUI,图形化测试

讨论制作图形化界面的方法并且介绍经常使用的组件,帮助读者实现测试工具图形化以及了解底层实现的思路。

第16章 实战案例part5 知乎

着重讨论Selenium项目和传统方式的爬虫的结合,实现一种全新的,功能更加强大的数据采集爬虫。

第17章 实战案例part6 微博

对全书的内容的整合提升,帮助读者巩固已经学过的知识,构筑全面的知识框架,了解自己的不足与缺陷。

关于本书的勘误:

限于我能力不足,加之个人精力有限,本书难免有错误之处.

勘误发布: http://note.youdao.com/noteshare?id=a7f0705acb54486b627de091ab277314&sub=94EB566C5FB441159FA82618AD3A9090

本书的获取:

链接:https://www.lanzous.com/b588019/ 密码:9968

Releases

No releases published

Packages

No packages published

Languages