四时宝库

程序员的知识宝库

Python启航:30天编程速成之旅(第24天)- 实用程序片段

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

前期基础教程:

「Python3.11.0」手把手教你安装最新版Python运行环境

讲讲Python环境使用Pip命令快速下载各类库的方法

Python启航:30天编程速成之旅(第2天)-IDE安装

【Python教程】JupyterLab 开发环境安装


Python启航:30天编程速成之旅(第24天)- 实用程序片段

使用Python提取中文字符和中文标点符号

在这个教程中,我们将学习如何使用Python从字符串中提取中文字符和中文标点符号。我们将使用正则表达式库 re 来完成这个任务。以下是完整的代码示例,并附有详细注释和解释。

1. 导入re库

首先,我们需要导入 Python 的正则表达式库 re。这个库提供了强大的功能来处理字符串中的模式匹配。

import re

2. 定义函数extract_chinese_and_punctuation

我们定义一个名为 extract_chinese_and_punctuation 的函数,该函数接受一个字符串参数 text,并返回一个新的字符串,其中只包含中文字符和中文标点符号。

def extract_chinese_and_punctuation(text):

3. 创建正则表达式模式combined_pattern

接下来,我们创建一个正则表达式模式 combined_pattern,用于匹配中文字符和常见的中文标点符号。

  • 中文字符范围: \u4e00-\u9fff中文字符的 Unicode 编码范围是从 \u4e00 到 \u9fff。
  • 常见中文标点符号:逗号:, (U+FF0C)句号:。 (U+3002)感叹号:! (U+FF01)问号:? (U+FF1F)分号:; (U+FF1B)冒号:: (U+FF1A)引号:“”‘’ (U+201C, U+201D, U+2018, U+2019)圆括号:() (U+FF08, U+FF09)方括号:【】 (U+3010, U+3011)角括号:《》 (U+300A, U+300B)顿号:、 (U+3001)

将这些字符合并到一个字符类中:

    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'

4. 使用re.findall查找所有匹配的字符

我们使用 re.findall 函数来查找所有符合 combined_pattern 的字符。re.findall 返回一个列表,其中包含所有匹配的子串。

    result = ''.join(re.findall(combined_pattern, text))
  • re.findall(pattern, string):在字符串 string 中查找所有与 pattern 匹配的子串,并返回一个列表。
  • ''.join(...):将列表中的所有元素连接成一个字符串。

5. 返回结果

最后,我们返回处理后的字符串 result。

    return result

6. 示例用法

我们提供一个示例字符串 text,并调用 extract_chinese_and_punctuation 函数来提取其中的中文字符和中文标点符号。

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)  # 输出: 你好!这是一个测试。

7.完整代码

import re

def extract_chinese_and_punctuation(text):
    # 中文字符和常见中文标点符号的范围
    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'
    
    # 查找所有匹配的字符
    result = ''.join(re.findall(combined_pattern, text))
    return result

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)

使用Python将长文本按指定长度分段

在这个教程中,我们将学习如何使用Python将长文本按指定的长度分段。我们将编写一个函数 split_text,该函数接受一个字符串和一个整数参数,并返回一个包含多个子字符串的列表,每个子字符串的长度不超过指定的长度。

详细步骤解析

1. 定义函数split_text

我们定义一个名为 split_text 的函数,该函数接受两个参数:

  • text: 要分割的长文本。
  • length: 每个子字符串的最大长度,默认值为20。
def split_text(text, length=20):
    """将长文本按指定长度分段"""

2. 使用列表推导式进行分段

在函数内部,我们使用列表推导式来生成一个包含多个子字符串的列表。每个子字符串的长度不超过指定的 length。

    return [text[i:i+length] for i in range(0, len(text), length)]

解释列表推导式

  • range(0, len(text), length): 生成一个从0开始到 len(text) 结束的序列,步长为 length。例如,如果 text 的长度为50,length 为20,则生成的序列为 [0, 20, 40]。
  • text[i:i+length]: 从 text 中切片,从索引 i 开始,到索引 i+length 结束(不包括 i+length)。例如,当 i 为0时,切片为 text[0:20];当 i 为20时,切片为 text[20:40]。
  • [...]: 将所有切片结果收集到一个列表中。

3. 示例用法

我们提供一个示例字符串 text,并调用 split_text 函数来将其按指定长度分段。

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

输出结果

运行上述代码后,输出将是:

['通过本教程,你已经学会', '了如何使用Python的正则表', '达式库 re 来提取字', '符串中的中文字符', '和中文标点符号。这种方', '法不仅高效,而且易', '于理解。希望这个教', '程对你有所帮助!']

每个子字符串的长度不超过20个字符。

4.完整代码

def split_text(text, length=20):
    """将长文本按指定长度分段"""
    return [text[i:i+length] for i in range(0, len(text), length)]

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

使用Python根据出生日期计算年龄

在这个教程中,我们将学习如何使用Python根据出生日期计算一个人的年龄。我们将编写一个函数 calculate_age,该函数接受一个字符串形式的出生日期,并返回相应的年龄。

详细步骤解析

1. 导入datetime模块

首先,我们需要导入 Python 的 datetime 模块。这个模块提供了处理日期和时间的功能。

from datetime import datetime

2. 定义函数calculate_age

我们定义一个名为 calculate_age 的函数,该函数接受一个参数:

  • birth_date: 字符串形式的出生日期,格式为 'YYYY-MM-DD'。
def calculate_age(birth_date):
    """根据出生日期计算年龄"""

3. 获取当前日期

使用 datetime.now() 方法获取当前的日期和时间。

    today = datetime.now()

解释

  • datetime.now(): 返回当前的本地日期和时间。

4. 将出生日期字符串转换为datetime对象

使用 datetime.strptime 方法将字符串形式的出生日期转换为 datetime 对象。

    birth = datetime.strptime(birth_date, '%Y-%m-%d')

解释

  • datetime.strptime(date_string, format): 根据指定的格式将字符串解析为 datetime 对象。
  • '%Y-%m-%d': 表示日期格式为四位数的年份、两位数的月份和两位数的日期,例如 '1979-03-26'。

5. 计算初步年龄

通过减去出生年份和当前年份来计算初步的年龄。

    age = today.year - birth.year

解释

  • today.year: 当前年的年份。
  • birth.year: 出生年的年份。
  • age = today.year - birth.year: 初步计算年龄,假设今天已经是生日过了。

6. 调整年龄以考虑月份和日期

如果当前月份小于出生月份,或者当前月份等于出生月份但当前日期小于出生日期,则需要将年龄减一。

    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1

解释

  • today.month < birth.month: 如果当前月份小于出生月份。
  • today.month == birth.month and today.day < birth.day: 如果当前月份等于出生月份且当前日期小于出生日期。
  • age -= 1: 如果上述条件之一为真,则年龄减一。

7. 返回计算得到的年龄

最后,返回计算得到的年龄。

    return age

8. 示例用法

我们提供一个示例出生日期 '1979-03-26',并调用 calculate_age 函数来计算相应的年龄。

print(calculate_age('1980-01-01'))

输出结果

运行上述代码后,输出将是当前日期对应的年龄。例如,如果当前日期是2024年12月10日,则输出可能是:

44

9.完整代码

from datetime import datetime

def calculate_age(birth_date):
    """根据出生日期计算年龄"""
    today = datetime.now()
    birth = datetime.strptime(birth_date, '%Y-%m-%d')
    age = today.year - birth.year
    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1
    return age

print(calculate_age('1980-01-01'))

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接