Python:用正则表达式从含多种字符的字符串中提取英文、数字和中文单词
可以使用正则表达式来提取字符串中的英文单词、数字和中文单词。以下是一个示例代码: ```python import re def extract_words(text): # 提取英文单词 words_en = re.findall(r'\b\w+\b', text) # 提取数字 numbers = re.findall(r'[0-9]+', text) # 提取中文单词 words_cn = re.findall(r'[\u4e00-\u9fa5]+', text) return words_en, numbers, words_cn text = "Hello, 123, 世界" words_en, numbers, words_cn = extract_words(text) print(words_en) # 输出: ['Hello'] print(numbers) # 输出: ['123'] print(words_cn) # 输出: ['世界'] ``` 以上代码通过正则表达式 `\b\w+\b` 来提取英文单词,通过正则表达式 `[0-9]+` 来提取数字,通过正则表达式 `[\u4e00-\u9fa5]+` 来提取中文单词。最后将提取到的英文单词、数字和中文单词分别保存在 `words_en`、`numbers`、`words_cn` 变量中。 ######[AI写代码神器 | 522点数解答 | 2024-05-31 19:05:27]
相关提问
- C++实现读取数字并输出最小值的代码及解释(字节豆包 | 113点数解答 | 2026-03-20 19:32:56)5
- C++ 求解:最少操作次数让字符串无子串 “friend” (字节豆包 | 153点数解答 | 2024-08-17 16:29:54)476
- C++ 求解:最少操作次数让字符串不再含 “friend” 子串!(讯飞星火 | 260点数解答 | 2024-08-17 16:30:49)462
- Python 巧解:最少操作次数让字符串告别“friend”子串(字节豆包 | 139点数解答 | 2024-08-18 13:04:14)399
- 3414 数字游戏:Python 求解 8 位 01 字符串中 1 的个数 (字节豆包 | 106点数解答 | 2024-10-27 14:23:27)425
- 巧用字符添加,计算字符串中“our”最大数量及开发注意要点(DeepSeek | 376点数解答 | 2025-10-30 19:20:06)77
- C 语言实现:处理字符串生成最多 “our” 串,附代码及关键开发注意点 (DeepSeek | 257点数解答 | 2025-10-30 19:20:36)106
- Python 运行报错:urllib3 网络连接创建失败,原因及排查建议(字节豆包 | 161点数解答 | 2024-10-31 00:39:36)458
- C++ 实现:精准统计给定范围 [L, R] 内数字 2 出现的次数及代码详解(字节豆包 | 401点数解答 | 2026-02-05 21:17:05)36
- C++实现:统计[L, R]范围内数字2出现的次数及代码详解(字节豆包 | 489点数解答 | 2026-02-07 17:12:26)41
- 代码漏洞大揭秘:Pandas数据预处理逻辑、细节全修正!(字节豆包 | 635点数解答 | 2025-06-25 15:46:50)173
- “广”加密会变“歧”?常见加密算法里并无此结果! (阿里通义 | 136点数解答 | 2023-12-18 13:46:31)244