运算符
+ 1+2=3 优先级3
- 1-2=-1 优先级3
* 1*2=2 优先级2
/ 10/20=0.5 优先级2
// 取整 9//2=4 优先级2
% 取余 9%2=1 优先级2
** 幂 2**3=8 优先级1
变量的类型
数字型:整形(int)、浮点型(float)、布尔型(bool)真假、复数型(complex)主要用于科学计算
非数字型:字符串、列表、元组、字典
网络请求:
- urllib
- requests
- selenium(UI自动测试、动态Js渲染)
- appium(手机App的爬虫或UI测试)
数据解析:
- re正则
- xpath
- bs4
- json
数据提取的解析方式
- re解析
- bs4解析
- xpath解析
re解析:
常用的元字符:
. 匹配除换行以外的任意字符
\w 匹配数字、字母、下划线
\s 匹配任意的空白字符
\d 匹配数字
\n 匹配一个换行符
\t 匹配一个制表符
^ 匹配字符串的开始
$ 匹配字符串的结尾
\W 匹配非数字、字母、下划线
\D 匹配非数字
\S 匹配非空白符
a|b匹配字符a或字符b
() 匹配括号内的表达式,也表示一个组
[…] 匹配字符组中的字符
[^..] 匹配除了字符组中字符的所有字符
量词:控制前面的元字符出现的次数
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或者更多次
{n,m} 重复n到m次
评论 (0)