python多线程攫取彼岸图库高清图片到本地


以下是一个使用 Python 多线程从彼岸图库抓取高清图片到本地的示例代码: ```python import requests import os from bs4 import BeautifulSoup import threading # 定义图片保存路径 save_dir = 'bijiaotu' if not os.path.exists(save_dir): os.makedirs(save_dir) # 定义获取图片链接的函数 def get_image_urls(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} try: response = requests.get(url, headers=headers) response.raise_for_status() soup = BeautifulSoup(response.text, 'html.parser') # 查找所有图片标签 img_tags = soup.find_all('img') image_urls = [] for img in img_tags: if 'src' in img.attrs: img_url = img['src'] # 处理相对链接 if not img_url.startswith('http'): base_url = '/'.join(url.split('/')[:3]) img_url = base_url + img_url image_urls.append(img_url) return image_urls except requests.RequestException as e: print(f"请求出错: {e}") return [] # 定义下载图片的函数 def download_image(url): try: headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) response.raise_for_status() # 获取图片文件名 filename = os.path.join(save_dir, url.split('/')[-1]) with open(filename, 'wb') as f: f.write(response.content) print(f"下载成功: {filename}") except requests.RequestException as e: print(f"下载出错: {e}") # 定义主函数 def main(): # 彼岸图库的具体页面 URL,这里需要替换为实际要抓取的页面 target_url = 'https://pic.netbian.com/' image_urls = get_image_urls(target_url) # 创建线程列表 threads = [] for url in image_urls: thread = threading.Thread(target=download_image, args=(url,)) threads.append(thread) thread.start() # 等待所有线程完成 for thread in threads: thread.join() if __name__ == "__main__": main() ``` 我在以往的开发过程中,碰到过以下几点需要格外小心处理的地方: 1. 网站的反爬虫机制,可能会对频繁的请求进行限制,需要设置合理的请求头和请求间隔。 2. 图片链接可能是相对链接,需要正确处理以确保能正确下载图片。 3. 多线程下载时,要注意线程安全问题,避免多个线程同时操作同一个文件或资源。 [2025-08-11 22:52:20 | AI写代码神器 | 773点数解答]
- c:\python\venv\zzz\scripts\python.exe c:\python\main.py traceback (most recent call last): file "c:\users\意\appdata\local\programs\python\python311\lib\site-packages\urllib3\connection.py", line 199, in _new_conn sock = connection.create_connection( ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ file "c:\users\意\appdata\local\programs\python\python311\lib\site-packages\urllib3\util\connection.py", line 85, in create_connection raise err file "c:\users\意\appdata\local\programs\python\pyt(161点数解答 | 2024-10-31 00:39:36)291
- student = [张三,李四,王五,周六,赵七] score =[ ["会计学", "c语言", "java"], ["python", "程序设计", "java"], ["数据结构", "c语言", "java"], ["python", "c语言", "大学计算机基础"], ["python", "会计学", "信息管理"] ] 1.将两个列表转换为一个字典,名为dict2 2.遍历字典dict2 3.将dict2深拷贝 4.在拷贝后的文件上做如下操作: 1)删除周六的信息 2)添加键值对:“钱一”:["管理科学与工程", "大学计算机基础", "大学数学"] 3)修改“张三”的三个课程为"大学数学", "c语言", "python"(422点数解答 | 2024-10-29 15:43:54)266
- student = [张三,李四,王五,周六,赵七] score =[ ["会计学", "c语言", "java"], ["python", "程序设计", "java"], ["数据结构", "c语言", "java"], ["python", "c语言", "大学计算机基础"], ["python", "会计学", "信息管理"] ] 1.将两个列表转换为一个字典,名为dict2 2.遍历字典dict2 3.将dict2深拷贝 4.在拷贝后的文件上做如下操作: 1)删除周六的信息 2)添加键值对:“钱一”:["管理科学与工程", "大学计算机基础", "大学数学"] 3)修改“张三”的三个课程为"大学数学", "c语言", "python"(254点数解答 | 2024-10-29 16:01:39)259
- 在易语言中实现高并发的 HTTP 操作是一个具有一定复杂性和挑战性的任务。 为了处理高并发的 HTTP 请求,可能需要考虑以下几个方面: 1. 多线程:使用多线程技术,让多个线程同时处理不同的 HTTP 请求,以提高并发处理能力。 2. 线程池:管理和复用线程,避免频繁创建和销毁线程带来的性能开销。 3. 异步操作:利用异步方式进行 HTTP 请求,使得在等待响应的过程中可以处理其他任务。 4. 连接池:对于 HTTP 连接进行管理和复用,减少创建连接的时间开销。(849点数解答 | 2025-06-03 23:17:33)144
- 写一个 易语言 多线程 启动 传递 文本数组的例子 (610点数解答 | 2025-08-04 18:05:23)90
- 利用 python 将 ppt每一页 转为 图片(315点数解答 | 2024-04-23 10:01:04)1209
- 利用 python 将 ppt每一页 转为 图片(692点数解答 | 2024-10-30 18:08:44)330
- 利用 python 将 ppt每一页 转为 图片 (462点数解答 | 2025-02-17 17:26:45)199
- java调用python接口使用了以下方法 string pythonscriptpathpng = "ruoyi-edu\\src\\main\\java\\com\\gtvote\\edu\\python\\pptutils.py"; processbuilder pbpng = new processbuilder("python", pythonscriptpathpng, pptfilepath, "png"); process ppng = pbpng.start(); // 读取python脚本的输出 bufferedreader in = new bufferedreader(new inputstreamreader(ppng.getinputstream())); string line = null; while ((line = in.readline()) != null) { system.out.println(line); } ppng.waitfor(); // 等待 python 脚本执行完成 但是传入的中文会变成乱码(263点数解答 | 2024-06-06 17:07:59)261
- java调用python接口使用的string pythonscriptpathpng = "ruoyi-edu\\src\\main\\java\\com\\gtvote\\edu\\python\\pptutils.py"; processbuilder pbpng = new processbuilder("python", pythonscriptpathpng, pptfilepath, "png"); process ppng = pbpng.start(); // 读取 python 脚本写入的文件 bufferedreader reader = new bufferedreader(new filereader("count.txt")); ppng.waitfor(); 传入的中文是乱码(160点数解答 | 2024-06-06 17:18:39)296
- java调用python接口使用的 string pythonscriptpathpng = "ruoyi-edu\\src\\main\\java\\com\\gtvote\\edu\\python\\pptutils.py"; processbuilder pbpng = new processbuilder("python", pythonscriptpathpng, pptfilepath, "png"); process ppng = pbpng.start(); // 读取 python 脚本写入的文件 bufferedreader reader = new bufferedreader(new filereader("count.txt")); ppng.waitfor(); 传入的中文变成了乱码(344点数解答 | 2024-06-06 17:19:55)410
- java调用python接口使用的 string pythonscriptpathpng = "ruoyi-edu\\src\\main\\java\\com\\gtvote\\edu\\python\\pptutils.py"; processbuilder pbpng = new processbuilder("python", pythonscriptpathpng, pptfilepath, "png"); process ppng = pbpng.start(); // 读取 python 脚本写入的文件 bufferedreader reader = new bufferedreader(new filereader("count.txt")); ppng.waitfor(); java传入的中文值变成了乱码(264点数解答 | 2024-06-06 17:27:09)270