Python实战:用代码爬取拼多多网页商品数据
import requests from bs4 import BeautifulSoup def scrape_pinduoduo(url): # 发送GET请求获取网页内容 response = requests.get(url) if response.status_code == 200: # 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.content, 'html.parser') # 找到所有商品信息的标签 products = soup.find_all('div', class_='goods-item') results = [] # 遍历每个商品信息标签,提取所需数据 for product in products: # 提取商品名称 name = product.find('div', class_='goods-name').text.strip() # 提取商品价格 price = product.find('div', class_='price').text.strip() # 提取商品销量 sales = product.find('div', class_='sales').text.strip() # 将提取的数据添加到结果列表中 results.append({'name': name, 'price': price, 'sales': sales}) return results else: print('Failed to load page:', response.status_code) # 调用函数进行爬取 url = 'https://www.pinduoduo.com/' data = scrape_pinduoduo(url) # 打印爬取的数据 for item in data: print('Name:', item['name']) print('Price:', item['price']) print('Sales:', item['sales']) print('------------------') ######[AI写代码神器 | 882点数解答 | 2024-12-09 16:25:32]
- Python 运行报错:urllib3 网络连接创建失败,原因及排查建议(字节豆包 | 161点数解答 | 2024-10-31 00:39:36)496
- Java代码实现从JSON数据中提取ID,涉及“数据”与“项目 - 知识库”结构(字节豆包 | 603点数解答 | 2025-04-15 22:48:51)255
- C++ 实现:计算一排鹅与最高、最矮鹅的身高差及代码详解(字节豆包 | 549点数解答 | 2025-11-16 20:19:06)105
- 编程揭秘:计算 𝑛! 在 𝑃 进制下末尾零个数的方法与代码实现(DeepSeek | 549点数解答 | 2026-01-11 17:49:54)63
- Python 实战:学生信息列表转字典、遍历、深拷贝及数据修改全流程(GPT | 422点数解答 | 2024-10-29 15:43:54)449
- Python实战:学生成绩列表转字典,深拷贝与数据修改操作全解析(字节豆包 | 254点数解答 | 2024-10-29 16:01:39)441
- 修复代码错误:解决 Python 格式化字符串引发的 ValueError 问题(字节豆包 | 187点数解答 | 2024-10-16 15:53:08)374
- 代码修复:解决“invalid format specifier”实现商品信息正确输出(字节豆包 | 204点数解答 | 2024-10-16 15:53:41)327
- 双11前小明巧用数据:计算机械键盘与游戏鼠标最近购买均价!(字节豆包 | 32点数解答 | 2024-10-17 20:43:03)225
- Java调用Python接口中文乱码?设置UTF - 8编码一招解决!(讯飞星火 | 263点数解答 | 2024-06-06 17:07:59)420
- 解决Java调用Python接口中文乱码问题:设置UTF - 8编码全攻略(讯飞星火 | 160点数解答 | 2024-06-06 17:18:39)443
- Java调用Python接口中文乱码问题:字符编码统一解决方案(讯飞星火 | 344点数解答 | 2024-06-06 17:19:55)550