commit d1960e334d3f62c2b5d7c04dc1d21381ffefbe63 · zenfyr.dev/xpost

+14 -10

bluesky/common.py

···

       68
        
           text: str = post.get('text', '')

     

       69
        
           if not text:

     

       70
        
               return []

     

       71
       -
           text = text.encode(encoding='utf-8').decode(encoding='utf-8')

     

       0
        
       
     

       0
        
       
     

       0
        
       
     

       72
        
           

     

       73
        
           facets: list[dict] = post.get('facets', [])

     

       74
        
           if not facets:

     

       75
       -
               return [cross.TextToken(text)]

     

       76
        
           

     

       77
        
           slices: list[tuple[int, int, str, str]] = []

     

       78
        
           

     
···

       94
        
                       slices.append((index['byteStart'], index['byteEnd'], 'mention', feature['did']))

     

       95
        
           

     

       96
        
           if not slices:

     

       97
       -
               return [cross.TextToken(text)]

     

       98
        
           

     

       99
        
           slices.sort(key=lambda s: s[0])

     

       100
        
           unique: list[tuple[int, int, str, str]] = []

     
···

       105
        
                   current_end = end

     

       106
        
           

     

       107
        
           if not unique:

     

       108
       -
               return [cross.TextToken(text)]

     

       109
        
           

     

       110
        
           tokens: list[cross.Token] = []

     

       111
        
           prev = 0

     
···

       113
        
           for start, end, ttype, val in unique:

     

       114
        
               if start > prev:

     

       115
        
                   # text between facets

     

       116
       -
                   tokens.append(cross.TextToken(text[prev:start]))

     

       117
        
               # facet token

     

       118
        
               match ttype:

     

       119
        
                   case 'link':

     

       120
       -
                       label = text[start:end]

     

       0
        
       
     

       121
        
                   

     

       122
        
                       # try to unflatten links

     

       123
        
                       split = val.split('://')

     
···

       129
        
                       else:

     

       130
        
                           tokens.append(cross.LinkToken(val, label))

     

       131
        
                   case 'tag':

     

       132
       -
                       tokens.append(cross.TagToken(text[start:end]))

     

       133
        
                   case 'mention':

     

       134
       -
                       tokens.append(cross.MentionToken(text[start:end], val))

     

       135
        
               prev = end

     

       136
        
       

     

       137
       -
           if prev < len(text):

     

       138
       -
               tokens.append(cross.TextToken(text[prev:]))

     

       139
        
           

     

       140
        
           return tokens    

     

       141

···

       68
        
           text: str = post.get('text', '')

     

       69
        
           if not text:

     

       70
        
               return []

     

       71
       +
           ut8_text = text.encode(encoding='utf-8')

     

       72
       +
           

     

       73
       +
           def decode(ut8: bytes) -> str:

     

       74
       +
               return ut8.decode(encoding='utf-8')

     

       75
        
           

     

       76
        
           facets: list[dict] = post.get('facets', [])

     

       77
        
           if not facets:

     

       78
       +
               return [cross.TextToken(decode(ut8_text))]

     

       79
        
           

     

       80
        
           slices: list[tuple[int, int, str, str]] = []

     

       81
        
           

     
···

       97
        
                       slices.append((index['byteStart'], index['byteEnd'], 'mention', feature['did']))

     

       98
        
           

     

       99
        
           if not slices:

     

       100
       +
               return [cross.TextToken(decode(ut8_text))]

     

       101
        
           

     

       102
        
           slices.sort(key=lambda s: s[0])

     

       103
        
           unique: list[tuple[int, int, str, str]] = []

     
···

       108
        
                   current_end = end

     

       109
        
           

     

       110
        
           if not unique:

     

       111
       +
               return [cross.TextToken(decode(ut8_text))]

     

       112
        
           

     

       113
        
           tokens: list[cross.Token] = []

     

       114
        
           prev = 0

     
···

       116
        
           for start, end, ttype, val in unique:

     

       117
        
               if start > prev:

     

       118
        
                   # text between facets

     

       119
       +
                   tokens.append(cross.TextToken(decode(ut8_text[prev:start])))

     

       120
        
               # facet token

     

       121
        
               match ttype:

     

       122
        
                   case 'link':

     

       123
       +
                       label = decode(ut8_text[start:end])

     

       124
       +
                       print(label)

     

       125
        
                   

     

       126
        
                       # try to unflatten links

     

       127
        
                       split = val.split('://')

     
···

       133
        
                       else:

     

       134
        
                           tokens.append(cross.LinkToken(val, label))

     

       135
        
                   case 'tag':

     

       136
       +
                       tokens.append(cross.TagToken(decode(ut8_text[start:end])))

     

       137
        
                   case 'mention':

     

       138
       +
                       tokens.append(cross.MentionToken(decode(ut8_text[start:end]), val))

     

       139
        
               prev = end

     

       140
        
       

     

       141
       +
           if prev < len(ut8_text):

     

       142
       +
               tokens.append(cross.TextToken(decode(ut8_text[prev:])))

     

       143
        
           

     

       144
        
           return tokens    

     

       145