nonebot-plugin-acgnshow/nonebot_plugin_acgnshow/util.py

import os
import re
import random
import datetime
import json
from pathlib import Path
from .config import config


def choose_random_bgimage() -> str:
    """
    从背景图片文件夹中随机选择一张图片，返回图片的uri地址
    """
    bgpath = Path(config.acgnshow_bgimage_path)
    randomfile = random.choice(os.listdir(bgpath))
    randomurl = (bgpath / randomfile).as_uri()
    return randomurl


def convert_timestamp(timestamp) -> str:
    """
    将时间戳转换为日期格式

    :param timestamp: unix 时间戳
    :return: yyyy-mm-dd hh:mm:ss时间
    """
    return datetime.datetime.fromtimestamp(timestamp).strftime("%Y-%m-%d %H:%M:%S")

def extract_banner_url(value) -> str:
    a = json.loads(value)
    url = "https:"+a["banner"]["url"]
    return url

def add_https_to_urls(html_content):
    """
    为 HTML 内容中的缺失 https: 前缀的 URL 添加 https: 前缀

    :param html_content: 包含 HTML 的字符串
    :return: 修正后的 HTML 字符串
    """
    # 使用正则表达式查找所有以 "//" 开头的 URL
    updated_html_content = re.sub(r'(?<=src=["\'])//', 'https://', html_content)
    return updated_html_content

def split_html_into_fragments(html_content):
    """
    将 HTML 内容按照元素分割成多个片段，并存储在列表中

    :param html_content: 包含 HTML 的字符串
    :return: 存储 HTML 片段的列表
    """
    # 使用正则表达式匹配 HTML 标签及其内容
    pattern = re.compile(r'(<[^>]+>[^<]*<\/[^>]+>|<[^>]+\/>|<[^>]+>)')
    fragments = pattern.findall(html_content)
    return fragments

def join_fragments_in_groups(fragments, image_count=2):
    """

    :param fragments: 存储 HTML 片段的列表
    :param image_count: 每个组包含的图片数量，默认为2
    :return: 拼接后的 HTML 列表
    """
    grouped_html = []
    count = 0
    buffer = ""
    for group in fragments:
        buffer += group
        if "img" in group:
            count += 1 # 发现图片则计数器+1
        if count >= image_count:
            grouped_html.append(buffer)
            count = 0
            buffer = "" # 初始化计数器和缓冲区
    grouped_html.append(buffer)# 把缓冲区剩余内容一起添加
    return grouped_html
-												格式化代码，细节优化，修复了图片边框不完整的问题

											
										
										
											2024-08-22 22:50:18 +08:00
+								import os
-												👀v0.2.3，添加3个配置项目，展览详情支持发送活动介绍栏目内容

											
										
										
											2024-08-30 16:48:14 +08:00
+								import re
-												✨初次提交

											
										
										
											2024-07-11 10:26:21 +00:00
+								import random
-												✨v0.1.4.2,在展览列表中显示出场嘉宾（数据不全？），展览开始时间精确到秒

											
										
										
											2024-08-08 20:50:18 +08:00
+								import datetime
-												✨v0.2，不会接受字数大于5的展览查询，添加展览详细信息展示，返回详细错误信息

											
										
										
											2024-08-24 22:20:42 +08:00
+								import json
-												添加新设置项，拆分css

											
										
										
											2024-08-24 17:44:52 +08:00
+								from pathlib import Path
 								from .config import config
-												格式化代码，细节优化，修复了图片边框不完整的问题

											
										
										
											2024-08-22 22:50:18 +08:00
-												:zap: 在请求中使用异步代替同步防止进程阻塞，优化部分代码样式

											
										
										
											2024-08-15 18:22:29 +08:00
-												格式化代码，细节优化，修复了图片边框不完整的问题

											
										
										
											2024-08-22 22:50:18 +08:00
+								def choose_random_bgimage() -> str:
 								    """
 								    从背景图片文件夹中随机选择一张图片，返回图片的uri地址
 								    """
-												添加新设置项，拆分css

											
										
										
											2024-08-24 17:44:52 +08:00
+								    bgpath = Path(config.acgnshow_bgimage_path)
 								    randomfile = random.choice(os.listdir(bgpath))
 								    randomurl = (bgpath / randomfile).as_uri()
-												✨v0.1.4.2,在展览列表中显示出场嘉宾（数据不全？），展览开始时间精确到秒

											
										
										
											2024-08-08 20:50:18 +08:00
+								    return randomurl
-												:zap: 在请求中使用异步代替同步防止进程阻塞，优化部分代码样式

											
										
										
											2024-08-15 18:22:29 +08:00
-												格式化代码，细节优化，修复了图片边框不完整的问题

											
										
										
											2024-08-22 22:50:18 +08:00
+								def convert_timestamp(timestamp) -> str:
 								    """
 								    将时间戳转换为日期格式
-												👀v0.2.3，添加3个配置项目，展览详情支持发送活动介绍栏目内容

											
										
										
											2024-08-30 16:48:14 +08:00
 								    :param timestamp: unix 时间戳
 								    :return: yyyy-mm-dd hh:mm:ss时间
-												格式化代码，细节优化，修复了图片边框不完整的问题

											
										
										
											2024-08-22 22:50:18 +08:00
+								    """
 								    return datetime.datetime.fromtimestamp(timestamp).strftime("%Y-%m-%d %H:%M:%S")
-												✨v0.2，不会接受字数大于5的展览查询，添加展览详细信息展示，返回详细错误信息

											
										
										
											2024-08-24 22:20:42 +08:00
 								def extract_banner_url(value) -> str:
 								    a = json.loads(value)
 								    url = "https:"+a["banner"]["url"]
-												👀v0.2.3，添加3个配置项目，展览详情支持发送活动介绍栏目内容

											
										
										
											2024-08-30 16:48:14 +08:00
+								    return url
 								def add_https_to_urls(html_content):
 								    """
 								    为 HTML 内容中的缺失 https: 前缀的 URL 添加 https: 前缀
 								    :param html_content: 包含 HTML 的字符串
 								    :return: 修正后的 HTML 字符串
 								    """
 								    # 使用正则表达式查找所有以 "//" 开头的 URL
 								    updated_html_content = re.sub(r'(?<=src=["\'])//', 'https://', html_content)
 								    return updated_html_content
 								def split_html_into_fragments(html_content):
 								    """
 								    将 HTML 内容按照元素分割成多个片段，并存储在列表中
 								    :param html_content: 包含 HTML 的字符串
 								    :return: 存储 HTML 片段的列表
 								    """
 								    # 使用正则表达式匹配 HTML 标签及其内容
 								    pattern = re.compile(r'(<[^>]+>[^<]*<\/[^>]+>|<[^>]+\/>|<[^>]+>)')
 								    fragments = pattern.findall(html_content)
 								    return fragments
 								def join_fragments_in_groups(fragments, image_count=2):
 								    """
 								    :param fragments: 存储 HTML 片段的列表
 								    :param image_count: 每个组包含的图片数量，默认为2
 								    :return: 拼接后的 HTML 列表
 								    """
 								    grouped_html = []
 								    count = 0
 								    buffer = ""
 								    for group in fragments:
 								        buffer += group
 								        if "img" in group:
 								            count += 1 # 发现图片则计数器+1
 								        if count >= image_count:
 								            grouped_html.append(buffer)
 								            count = 0
 								            buffer = "" # 初始化计数器和缓冲区
 								    grouped_html.append(buffer)# 把缓冲区剩余内容一起添加
 								    return grouped_html