您现在的位置是:网站首页> 编程资料编程资料
Python基础第三方模块requests openpyxl_python_
2023-05-25
382人已围观
简介 Python基础第三方模块requests openpyxl_python_
一、第三方模块的下载与使用
1、什么是第三方模块
- 第三方模块是指别人编写的模块
- 第三方模块一般功能都比较强大
2、如何安装第三方模块
方式一:pip工具
安装方式:
1、打开python解释器的安装目录,找到Scipts目录,该目录下会有pip.exe的程序,这个程序就是用来安装第三方模块的
2、将python版本对应的Scipts文件目录添加至系统环境变量
3、打开cmd命令提示符窗口,在cmd命令窗口中运行下载第三方模块的句式
下载第三方模块的句式 pip install 模块名 下载第三方模块临时切换仓库 pip install 模块名 -i 仓库地址 下载第三方模块指定版本(不指定默认是最新版) pip install 模块名==版本号 -i 仓库地址
注意事项:
我们的电脑中可能安装了多个版本的python解释器,每个版本中都有pip工具,在我们使用pip安装模块时,需要下载在我们使用的版本中的pip工具中,否则下载的模块将无法运行
方式二:pycharm中下载
安装方式:
1、在pycharm中点击左上角File
2、在下方目录中找到Settings
3、找到Project,打开python Interpreter
4、点击'+'号,在上方窗口内输入想要下载的模块
5、点击Install Package,等待即可下载完成
注意事项:
1、在安装窗口右侧找到Specify versin 可选择需要下载模块版本号
2、Manage Repositories可配置仓库地址
3、注意事项
1、报错并有警告信息
WARNING: You are using pip version 20.2.1;
- 原因在于pip版本过低 只需要拷贝后面的命令执行更 新操作即可
d:\python38\python.exe -m pip install --upgrade pip
- 更新完成后再次执行下载第三方模块的命令即可
2、报错,提示关键字
Timeout
- 提示该关键字说明当前计算机网络不稳定,只需更换网络或等待网络稳定后下载即可
3、报错,无关键字
面向百度搜索
- 只需拷贝报错信息到百度搜索即可
- 通常都是需要用户提前准备好一些下载环境才可以顺利下载
4、下载速度慢
pip的默认下载地址都是国外的,我们只需要切换下载地址即可
- 关于切换下载地址的方式在上面已经说明
- 常用下载地址
清华大学 :
https://pypi.tuna.tsinghua.edu.cn/simple/阿里云:
http://mirrors.aliyun.com/pypi/simple/中国科学技术大学 :
http://pypi.mirrors.ustc.edu.cn/simple/华中科技大学:
http://pypi.hustunique.com/豆瓣源:
http://pypi.douban.com/simple/腾讯源:
http://mirrors.cloud.tencent.com/pypi/simple华为镜像源:
https://repo.huaweicloud.com/repository/pypi/simple/
二、网络爬虫之requests模块
1、简介
- requests模块是一个第三方模块,需要在额外进行安装
- 它是一个用于网络请求的模块,主要用来向浏览器发送请求
2、使用方法
导入模块:
import requests
1.关键词:get( )
作用:用于向浏览器发送请求
代码用法:
url = "https://www.baidu.com" res = requests.get(url)
2.关键词:encoding
作用:指定编码格式,针对一些古老的网站,在获取网页信息的时候,不指定编码格式的话可能会出现乱码。不指定的情况下默认使用系统自带的编码环境
代码用法:
res = encoding = 'utf8'
3.关键词:content
作用:返回的是一个原生字符串,是bytes类型
代码用法:
print(res.content) # 返回的是一个原生字符串,是bytes类型
4.关键词:text
作用:获取字符串类型的网页数据(默认按照utf8)
代码用法:
print(res.text) # 获取字符串类型的网页数据(默认按照utf8)
5.关键词:url
作用:打印请求
代码用法:
print(res.url)
6.关键词:status_code
作用:打印状态码
代码用法:
print(res.staus_code)
三、网络爬虫实战
1、爬取链家网站房屋信息
import re import requests from openpyxl import Workbook url = 'https://sh.lianjia.com/ershoufang/pg1/' for i in range(1, 101): url = f"https://sh.lianjia.com/ershoufang/pg{i}/" print(url) res = requests.get(url) url_data = res.text home_biaoqian = re.findall( """data-is_focus="" data-sl="">(.*?)""", url_data) home_xiaoqu_name = re.findall( """(.*?)""", url_data) home_xiaoqu_dir = re.findall("""(.*?)""", url_data) home_jutixinxi = re.findall("""(.*?)""", url_data) home_guanzhudu = re.findall("""(.*?)""", url_data) home_zongjia = re.findall("""(.*?)""", url_data) home_danjia = re.findall("""(.*?)""", url_data) home_data = zip(home_xiaoqu_name, home_xiaoqu_dir, home_biaoqian, home_jutixinxi, home_guanzhudu, home_zongjia, home_danjia) with open(r'sh_.txt', 'w', encoding='utf8') as f: for i in home_data: f.write(''' 小区名称:%s 小区地址:%s 小区标签:%s 详情:%s 关注度:%s 总价:%s 单价:%s\r '''%i) 四、openpyxl模块
1、简介
- openpyxl模块属于第三方模块,是一个在 python 中能够处理 excel 文件的模块,还有比较出名的是xlrd、xlwt 分别控制excel文件的读写,这俩个能够兼容所有版本的文件。openpyxl 针对 excel 2003版本之前的兼容性可能不好 但是功能更加强大。
注意事项:
excel文件的版本及后缀
2003版本之前 excel的文件后缀是xls
2003版本之后 excel的文件后缀是xlsx、csv
2、创建文件相关
2、1.创建excel文件
关键词:workbook
作用:
- 使用 openpyxl 创建文件。只需导入Workbook类
代码用法:
导入模块: form openpyxl import workbook 代码用法: from openpyxl import Workbook wb = Workbook # 一个 excel 文件创建成功
2、2.创建工作簿
关键词:cerate_sheet( )
作用:
- 使用 openpyxl 创可以创建自定义名称的工作簿。括号里的参数是工作簿名称,还有一个参数是工作簿的位置,也可以不写建文件。只需导入Workbook类
- 可以创建多个工作簿,并且可按照顺序排列
代码用法:
导入模块: form openpyxl import workbook 代码用法: from openpyxl import Workbook wb = Workbook() ws1 = wb.cerate_sheet('工作簿名称', 0) 
sheet 是自动生成的
2、3.修改工作簿名称
关键词:title
作用:
- 可以更改工作簿名称
- 通过待修改名称工作簿‘点’的方式在后方赋予新的名称
代码用法:
导入模块: form openpyxl import workbook 代码用法: from openpyxl import Workbook wb = Workbook() ws1 = wb.cerate_sheet('用户信息表', 0) ws1.title = 'user_infor' 
2、4.修改工作簿颜色
关键词:sheet_properties.tabColor
作用:
- 用来给工作簿背景修改颜色,需要用到RGB色域
代码用法:
导入模块: from openpyxl import Workbook wb = Workbook() ws1 = wb.create_sheet('用户信息表', 0) ws1.sheet_properties.tabColor = 'FF6666' # 将标题背景改为指定RRGGBB颜色代码 提示:
本文由神整理自网络,如有侵权请联系本站删除!
本站声明:
1、本站所有资源均来源于互联网,不保证100%完整、不提供任何技术支持;
2、本站所发布的文章以及附件仅限用于学习和研究目的;不得将用于商业或者非法用途;否则由此产生的法律后果,本站概不负责!
相关内容
- Python基础之hashlib模块subprocess模块logging模块_python_
- 如何使用python读取Excel指定范围并转为数组_python_
- Python基础面向对象之继承与派生详解_python_
- Python实现批量修改xml文件的脚本_python_
- 详解Python的整数是如何实现的_python_
- Python if 判断语句详解_python_
- python中isdigit() isalpha()用于判断字符串的类型问题_python_
- Python+Pygame实现代码雨动画效果_python_
- Python之列表的append()方法最容易踩的坑_python_
- Python list append方法之给列表追加元素_python_
