标签搜索

python基础认识

ctkj
2022-03-02 / 0 评论 / 12 阅读 / 正在检测是否收录...

运算符

+ 1+2=3 优先级3
- 1-2=-1 优先级3
* 1*2=2 优先级2
/ 10/20=0.5 优先级2
// 取整 9//2=4 优先级2
% 取余 9%2=1 优先级2
** 幂 2**3=8 优先级1

变量的类型

数字型:整形(int)、浮点型(float)、布尔型(bool)真假、复数型(complex)主要用于科学计算

非数字型:字符串、列表、元组、字典

网络请求:

  • urllib
  • requests
  • selenium(UI自动测试、动态Js渲染)
  • appium(手机App的爬虫或UI测试)

数据解析:

  1. re正则
  2. xpath
  3. bs4
  4. json

数据提取的解析方式

  1. re解析
  2. bs4解析
  3. xpath解析

re解析:

常用的元字符:

. 匹配除换行以外的任意字符
\w 匹配数字、字母、下划线
\s 匹配任意的空白字符
\d 匹配数字
\n 匹配一个换行符
\t 匹配一个制表符

^ 匹配字符串的开始
$ 匹配字符串的结尾

\W 匹配非数字、字母、下划线
\D 匹配非数字
\S 匹配非空白符
a|b匹配字符a或字符b
() 匹配括号内的表达式,也表示一个组
[…] 匹配字符组中的字符
[^..] 匹配除了字符组中字符的所有字符

量词:控制前面的元字符出现的次数

* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或者更多次
{n,m} 重复n到m次

0

评论 (0)

取消