commit 4d0cc0f2fc863efde75c3772c36bac1159f02131 · zenfyr.dev/xpost

+80 -101
util/html_util.py
···

       5
       5
        
           def __init__(self) -> None:

     

       6
       6
        
               super().__init__()

     

       7
       7
        
               self.tokens: list[cross.Token] = []

     

       8
       8
       -
               self.status: dict

     

       9
       8
        
               

     

       10
       9
        
               self.mentions: list[tuple[str, str]]

     

       11
       10
        
               self.tags: list[str]

     
···

       28
       27
        
                       if isinstance(last_token, cross.TextToken) and not last_token.text.endswith('\n'):

     

       29
       28
        
                           self.tokens.append(cross.TextToken('\n'))

     

       30
       29
        
               

     

       31
       31
       -
               if tag == 'br':

     

       32
       32
       -
                   self.tokens.append(cross.TextToken('  \n'))

     

       33
       33
       -
               

     

       34
       34
       -
               elif tag == 'a':

     

       35
       35
       -
                   href = attrs_dict.get('href', '')

     

       36
       36
       -
                   self.anchor_stack.append(href)

     

       37
       37
       -
               

     

       38
       38
       -
               elif tag == 'strong' or tag == 'b':

     

       39
       39
       -
                   self.tokens.append(cross.TextToken('**'))

     

       40
       40
       -
               

     

       41
       41
       -
               elif tag == 'em' or tag == 'i':

     

       42
       42
       -
                   self.tokens.append(cross.TextToken('*'))

     

       43
       43
       -
                   

     

       44
       44
       -
               elif tag == 'del' or tag == 's':

     

       45
       45
       -
                   self.tokens.append(cross.TextToken('~~'))

     

       46
       46
       -
                   

     

       47
       47
       -
               elif tag == 'code':

     

       48
       48
       -
                   if not self.in_pre:

     

       49
       49
       -
                       self.tokens.append(cross.TextToken('`'))

     

       50
       50
       -
                       self.in_code = True

     

       51
       51
       -
               

     

       52
       52
       -
               elif tag == 'pre':

     

       53
       53
       -
                   append_newline()

     

       54
       54
       -
                   self.tokens.append(cross.TextToken('```\n'))

     

       55
       55
       -
                   self.in_pre = True

     

       56
       56
       -
                       

     

       57
       57
       -
               elif tag == 'blockquote':

     

       58
       58
       -
                   append_newline()

     

       59
       59
       -
                   self.tokens.append(cross.TextToken('\n> '))

     

       60
       60
       -
               

     

       61
       61
       -
               elif tag == 'ul':

     

       62
       62
       -
                   self.list_stack.append('ul')

     

       63
       63
       -
                   append_newline()

     

       64
       64
       -
                   

     

       65
       65
       -
               elif tag == 'ol':

     

       66
       66
       -
                   self.list_stack.append('ol')

     

       67
       67
       -
                   append_newline()

     

       68
       68
       -
               

     

       69
       69
       -
               elif tag == 'li':

     

       70
       70
       -
                   indent = '  ' * (len(self.list_stack) - 1)

     

       71
       71
       -
                   if self.list_stack and self.list_stack[-1] == 'ul':

     

       72
       72
       -
                       self.tokens.append(cross.TextToken(f'{indent}- '))

     

       73
       73
       -
                   elif self.list_stack and self.list_stack[-1] == 'ol':

     

       74
       74
       -
                       self.tokens.append(cross.TextToken(f'{indent}1. '))

     

       75
       75
       -
               

     

       76
       76
       -
               elif tag == {'h1', 'h2', 'h3', 'h4', 'h5', 'h6'}:

     

       77
       77
       -
                   level = int(tag[1])

     

       78
       78
       -
                   self.tokens.append(cross.TextToken("\n" + "#" * level + " "))

     

       30
       30
       +
               match tag:

     

       31
       31
       +
                   case 'br':

     

       32
       32
       +
                       self.tokens.append(cross.TextToken('  \n'))

     

       33
       33
       +
                   case 'a':

     

       34
       34
       +
                       href = attrs_dict.get('href', '')

     

       35
       35
       +
                       self.anchor_stack.append(href)

     

       36
       36
       +
                   case 'strong', 'b':

     

       37
       37
       +
                       self.tokens.append(cross.TextToken('**'))

     

       38
       38
       +
                   case 'em', 'i':

     

       39
       39
       +
                       self.tokens.append(cross.TextToken('*'))

     

       40
       40
       +
                   case 'del', 's':

     

       41
       41
       +
                       self.tokens.append(cross.TextToken('~~'))

     

       42
       42
       +
                   case 'code':

     

       43
       43
       +
                       if not self.in_pre:

     

       44
       44
       +
                           self.tokens.append(cross.TextToken('`'))

     

       45
       45
       +
                           self.in_code = True

     

       46
       46
       +
                   case 'pre':

     

       47
       47
       +
                       append_newline()

     

       48
       48
       +
                       self.tokens.append(cross.TextToken('```\n'))

     

       49
       49
       +
                       self.in_pre = True

     

       50
       50
       +
                   case 'blockquote':

     

       51
       51
       +
                       append_newline()

     

       52
       52
       +
                       self.tokens.append(cross.TextToken('> '))

     

       53
       53
       +
                   case 'ul', 'ol':

     

       54
       54
       +
                       self.list_stack.append(tag)

     

       55
       55
       +
                       append_newline()

     

       56
       56
       +
                   case 'li':

     

       57
       57
       +
                       indent = '  ' * (len(self.list_stack) - 1)

     

       58
       58
       +
                       if self.list_stack and self.list_stack[-1] == 'ul':

     

       59
       59
       +
                           self.tokens.append(cross.TextToken(f'{indent}- '))

     

       60
       60
       +
                       elif self.list_stack and self.list_stack[-1] == 'ol':

     

       61
       61
       +
                           self.tokens.append(cross.TextToken(f'{indent}1. '))

     

       62
       62
       +
                   case _:

     

       63
       63
       +
                       if tag in {'h1', 'h2', 'h3', 'h4', 'h5', 'h6'}:

     

       64
       64
       +
                           level = int(tag[1])

     

       65
       65
       +
                           self.tokens.append(cross.TextToken("\n" + "#" * level + " "))

     

       79
       66
        
               

     

       80
       67
        
               self.current_tag_stack.append(tag)

     

       81
       68
        
           

     
···

       92
       79
        
               if tag in self.current_tag_stack:

     

       93
       80
        
                   self.current_tag_stack.remove(tag)

     

       94
       81
        
               

     

       95
       95
       -
               if tag == 'p':

     

       96
       96
       -
                   self.tokens.append(cross.TextToken('\n\n'))

     

       82
       82
       +
               match tag:

     

       83
       83
       +
                   case 'p':

     

       84
       84
       +
                       self.tokens.append(cross.TextToken('\n\n'))

     

       85
       85
       +
                   case 'a':

     

       86
       86
       +
                       href = self.anchor_stack.pop()

     

       87
       87
       +
                       anchor_data = ''.join(self.anchor_data)

     

       88
       88
       +
                       self.anchor_data = []

     

       97
       89
        
                   

     

       98
       98
       -
               elif tag == 'a':

     

       99
       99
       -
                   href = self.anchor_stack.pop()

     

       100
       100
       -
                   anchor_data = ''.join(self.anchor_data)

     

       101
       101
       -
                   self.anchor_data = []

     

       102
       102
       -
                   

     

       103
       103
       -
                   if anchor_data.startswith('#'):

     

       104
       104
       -
                       as_tag = anchor_data[1:].lower()

     

       105
       105
       -
                       if any(as_tag == block for block in self.tags):

     

       106
       106
       -
                           self.tokens.append(cross.TagToken(anchor_data[1:]))

     

       107
       107
       -
                   elif anchor_data.startswith('@'):

     

       108
       108
       -
                       match = next(

     

       109
       109
       -
                           (pair for pair in self.mentions if anchor_data in pair),

     

       110
       110
       -
                           None

     

       111
       111
       -
                       )

     

       90
       90
       +
                       if anchor_data.startswith('#'):

     

       91
       91
       +
                           as_tag = anchor_data[1:].lower()

     

       92
       92
       +
                           if any(as_tag == block for block in self.tags):

     

       93
       93
       +
                               self.tokens.append(cross.TagToken(anchor_data[1:]))

     

       94
       94
       +
                       elif anchor_data.startswith('@'):

     

       95
       95
       +
                           match = next(

     

       96
       96
       +
                              (pair for pair in self.mentions if anchor_data in pair),

     

       97
       97
       +
                               None

     

       98
       98
       +
                           )

     

       112
       99
        
                       

     

       113
       113
       -
                       if match:

     

       114
       114
       -
                           self.tokens.append(cross.MentionToken(match[1], ''))

     

       115
       115
       -
                   else:

     

       116
       116
       -
                       self.tokens.append(cross.LinkToken(href, anchor_data))

     

       117
       117
       -
               

     

       118
       118
       -
               elif tag == 'strong' or tag == 'b':

     

       119
       119
       -
                   self.tokens.append(cross.TextToken('**'))

     

       120
       120
       -
               

     

       121
       121
       -
               elif tag == 'em' or tag == 'i':

     

       122
       122
       -
                   self.tokens.append(cross.TextToken('*'))

     

       123
       123
       -
               

     

       124
       124
       -
               elif tag == 'del' or tag == 's':

     

       125
       125
       -
                   self.tokens.append(cross.TextToken('~~'))

     

       126
       126
       -
               

     

       127
       127
       -
               elif tag == 'code':

     

       128
       128
       -
                   if not self.in_pre and self.in_code:

     

       129
       129
       -
                       self.tokens.append(cross.TextToken('`'))

     

       130
       130
       -
                       self.in_code = False

     

       131
       131
       -
               

     

       132
       132
       -
               elif tag == 'pre':

     

       133
       133
       -
                   self.tokens.append(cross.TextToken('\n```\n'))

     

       134
       134
       -
                   self.in_pre = False

     

       135
       135
       -
       

     

       136
       136
       -
               elif tag == 'blockquote':

     

       137
       137
       -
                   self.tokens.append(cross.TextToken('\n'))

     

       138
       138
       -
               

     

       139
       139
       -
               elif tag == 'ul' or tag == 'ol':

     

       140
       140
       -
                   if self.list_stack:

     

       141
       141
       -
                       self.list_stack.pop()

     

       142
       142
       -
                   self.tokens.append(cross.TextToken('\n'))

     

       143
       143
       -
               

     

       144
       144
       -
               elif tag == 'li':

     

       145
       145
       -
                   self.tokens.append(cross.TextToken('\n'))

     

       146
       146
       -
               

     

       147
       147
       -
               elif tag in ['h1', 'h2', 'h3', 'h4', 'h5', 'h6']:

     

       148
       148
       -
                   self.tokens.append(cross.TextToken('\n'))

     

       100
       100
       +
                           if match:

     

       101
       101
       +
                               self.tokens.append(cross.MentionToken(match[1], ''))

     

       102
       102
       +
                       else:

     

       103
       103
       +
                           self.tokens.append(cross.LinkToken(href, anchor_data))

     

       104
       104
       +
                   case 'strong', 'b':

     

       105
       105
       +
                       self.tokens.append(cross.TextToken('**'))

     

       106
       106
       +
                   case 'em', 'i':

     

       107
       107
       +
                       self.tokens.append(cross.TextToken('*'))

     

       108
       108
       +
                   case 'del', 's':

     

       109
       109
       +
                       self.tokens.append(cross.TextToken('~~'))

     

       110
       110
       +
                   case 'code':

     

       111
       111
       +
                       if not self.in_pre and self.in_code:

     

       112
       112
       +
                           self.tokens.append(cross.TextToken('`'))

     

       113
       113
       +
                           self.in_code = False

     

       114
       114
       +
                   case 'pre':

     

       115
       115
       +
                       self.tokens.append(cross.TextToken('\n```\n'))

     

       116
       116
       +
                       self.in_pre = False

     

       117
       117
       +
                   case 'blockquote':

     

       118
       118
       +
                       self.tokens.append(cross.TextToken('\n'))

     

       119
       119
       +
                   case 'ul', 'ol':

     

       120
       120
       +
                       if self.list_stack:

     

       121
       121
       +
                           self.list_stack.pop()

     

       122
       122
       +
                       self.tokens.append(cross.TextToken('\n'))

     

       123
       123
       +
                   case 'li':

     

       124
       124
       +
                       self.tokens.append(cross.TextToken('\n'))

     

       125
       125
       +
                   case _:

     

       126
       126
       +
                       if tag in ['h1', 'h2', 'h3', 'h4', 'h5', 'h6']:

     

       127
       127
       +
                           self.tokens.append(cross.TextToken('\n'))

     

       149
       128
        
           

     

       150
       129
        
           def get_tokens(self) -> list[cross.Token]:

     

       151
       130
        
               if not self.tokens: