from typing import * import re import markdown class Header: def __init__(self, text: str): self.text = text def __call__(self, *args, **kwargs): """ 渲染标题 # 一级标题 ## 二级标题 ### 三级标题 #### 四级标题 ##### 五级标题 ###### 六级标题 :return: 处理后的文本 """ h6 = re.sub(r'###### (.*?)\n', r'
{code}
'
elif head in ('shell', 'python'):
self.codes[index] = f'{re.sub(f"({head})", "", code)}
'
elif head in ('mermaid',):
self.codes[index] = f'\(\1\)
', code) else: # 是突出块 self.codes[index] = f'{code}' def restore(self, new_text: str): """ 将渲染好的代码重新放回处理好的正文 :param new_text: 处理好的正文 :return: 加上代码的文章 """ for index, item in enumerate(self.codes): new_text = re.sub(f'\0\1{index}\1\0', f'{item}', new_text, flags=re.DOTALL) return new_text class Escape: # TODO 还有点问题 """ 转义\后字符 """ def __init__(self, text: str): """ 找出转义符并转义 :param text: 输入的文本 """ self.text = text self.escapes = { i: f'\0\1\2{i}\2\1\0' for i in re.findall(r'(\\.)', text) } # 找出要转义的字符 def __call__(self, *args, **kwargs): """ 临时移除代码块 :param args: :param kwargs: :return: 不含代码的文本 """ for index, item in self.escapes.items(): # 替换代码块为\0\1\2(id)\2\1\0 self.text = re.sub(fr'{re.escape(index)}', re.escape(item), self.text) # 同时转译特殊字符 print(item) return self.text def back(self, text): """ 将被转义的字符放回文本中 :param text: 新文本 :return: 放回转义字符的文本 """ for index, item in self.escapes.items(): # 替换\0\1\2(id)\2\1\0为转义字符 print(item) self.text = re.sub(item, '', text) # 同时转译特殊字符 return self.text def restore(self, new_text: str): """ 将渲染好的代码重新放回处理好的正文 :param new_text: 处理好的正文 :return: 加上代码的文章 """ for index, item in enumerate(self.escapes): new_text = re.sub(fr'-@@-{index}-@@-', f'{item}', new_text, flags=re.DOTALL) return new_text class Cite: """ > 渲染引用 --[引用来源] """ def __init__(self, text): self.text = text def __call__(self, *args, **kwargs) -> str: self.text = re.sub('> (.*?) --\[(.*?)]\n', r'\1', self.text) # 渲染有来源的引用 self.text = re.sub('> (.*?)\n', r'
\1\n', self.text) # 渲染没有来源的引用 return self.text class Syllabus: """ 1. 找到提纲 1.1 找到符合若干个‘数字+点+数字’且首尾都是数字的行 """ def __init__(self, text): self.text = text self.syllabus = {tuple(num.split('.')): txt for num, txt in re.findall(r'([\.|\d]+) ([^ ]+?)\n', self.text) if not num.endswith('.')} # 找出提纲 def __call__(self, *args, **kwargs): for num, txt in self.syllabus.items(): self.text = re.sub(f'{".".join(num)} {re.escape(txt)}', f'{"#" * len(num)}{".".join(num)} {txt}{{#' + '.'.join(num) + f'}}\n', self.text) # 按照层级为提纲添加不同等级的标题并创建锚点 print(self.text) return self.text class Basic: def __init__(self, text: str): self.text: str = text @staticmethod def strong_annotation(text: str) -> str: """ 移除|=强注释=| :param text: 原始文本 :return: 移除强注释后的文本 """ return re.sub('\|=[\s\S]*=\|', '', text, re.DOTALL) @staticmethod def week_annotation(text: str) -> str: """ 移除 // 弱注释 :param text: 原始文本 :return: 移除弱注释后的文本 """ return re.sub('// .*?\n', '\n', text) def paragraph(self): """ 为普通的行套上
段落标签
""" # TODO 有点问题 self.text = re.sub(r'(<.+?>.*?<.+?>)
\n', r'\1\n', # 移除已被标签包裹的行的额外的标签 '\n'.join( [ f'
{line}
' if not re.search('\0.+?\0', line) else line # 识别-@@-n-@@-并保留 for line in self.text.splitlines() # 把所有非空的行都套上标签 if not re.search(r'^\s*\n?$', line) # 识别空行或空白行 ] ) ) def __call__(self, *args, **kwargs): self.paragraph() return self.text def add_indent_to_string(input_string: str, indent_spaces: int = 4): """ 给字符串中的每一行前面加上缩进。 :param input_string: 原始字符串,可以包含多行。 :param indent_spaces: 每行前面要添加的空格数,默认为4。 :return: 带缩进的新字符串。 """ # 使用字符串的splitlines()方法分割原始字符串为行列表 lines = input_string.splitlines() # 遍历行列表,给每行前面加上相应的缩进,并重新组合成字符串 indented_string = "\n".join(f"{' ' * indent_spaces}{line}" for line in lines) return indented_string def body(text: str) -> Tuple[str, Dict[str, str]]: """ 渲染正文部分 :param text: 输入正文 :return: 输出渲染后的正文 """ escape = Escape(text) # 转义 text = escape() text = Basic.week_annotation(text) # 移除弱注释 text = Syllabus(text)() # 渲染提纲 text, values = Value(text)() # 提取变量并赋值到文本中 # text = Header(text)() # 渲染标题 text = Style(text)() # 渲染字体样式 # text = Link(text)() # 渲染特殊功能 # text = Cite(text)() # 渲染引用 # text = Basic(text)() # 渲染基础格式 text = markdown.markdown(text, extensions=['markdown.extensions.extra']) # 渲染标准markdown text = escape.back(text) # 放回被转义的字符 # text = Basic.paragraph(text) # 渲染段落 return text, values def main(origen: str): # 预处理、 origen = Basic.strong_annotation(origen) # 移除强注释 code_block = CodeBlock(origen) # 获取代码内容 text = code_block() # 暂时移除代码 # 处理正文 text, values = body(text) # 后处理 code_block.rendering(values) # 渲染代码 return code_block.restore(text) # 放回代码 if __name__ == '__main__': with open('README.md', encoding='utf-8') as test: cd = main(test.read()) with open('README.html', 'w', encoding='utf-8') as html: html.write(f"""