Differenze tra le versioni di "Individuare i valori costituenti i caratteri tipo UTF-8 di lettere localizzate"

Da Gambas-it.org - Wikipedia.
 
(Una versione intermedia di uno stesso utente non è mostrata)
Riga 1: Riga 1:
Come è noto, ogni carattere ASCII che ha un codice da 0 a 127 occupa un byte, invece set di caratteri come UTF-8 con lettere ''localizzate'' del tipo "à", "è", "é", "ì", "ò", "ù" e simili richiedono due o più valori del codice ASCII esteso. <SUP>&#91;[[#Note|Nota 1]]&#93;</sup>
+
Come è noto, ogni carattere ASCII che ha un codice da 0 a 127 occupa un byte, invece set di caratteri come UTF-8 con lettere ''localizzate'' del tipo "à", "è", "é", "ì", "ò", "ù" e simili richiedono due o più valori del codice ASCII esteso. <SUP>&#91;[[#Note|nota 1]]&#93;</sup>
  
 
E' possibile individuare tali valori costituenti le lettere ''localizzate'' mediante almeno quattro modalità.
 
E' possibile individuare tali valori costituenti le lettere ''localizzate'' mediante almeno quattro modalità.
Riga 6: Riga 6:
 
===Uso di un Vettore di tipo Byte[]===
 
===Uso di un Vettore di tipo Byte[]===
 
Questa modalità è molto semplice. Facciamo un esempio con una lettera costituita da due caratteri:
 
Questa modalità è molto semplice. Facciamo un esempio con una lettera costituita da due caratteri:
  '''Public''' Sub Main()   
+
  Public Sub Main()   
 
        
 
        
 
   Dim s As String = "è"   
 
   Dim s As String = "è"   
Riga 20: Riga 20:
 
   Print Chr(bb[0]); Chr(bb[1])   
 
   Print Chr(bb[0]); Chr(bb[1])   
 
        
 
        
  '''End'''
+
  End
  
  
 
===Uso della funzione "Asc()"===
 
===Uso della funzione "Asc()"===
 
Anche quest'altra modalità è abbastanza breve:
 
Anche quest'altra modalità è abbastanza breve:
  '''Public''' Sub Main()   
+
  Public Sub Main()   
 
    
 
    
 
   Print Hex(Asc("è", 1)), Hex(Asc("è", 2))
 
   Print Hex(Asc("è", 1)), Hex(Asc("è", 2))
Riga 32: Riga 32:
 
   Print Chr(Asc("è", 1)); Chr(Asc("è", 2))
 
   Print Chr(Asc("è", 1)); Chr(Asc("è", 2))
 
    
 
    
  '''End'''
+
  End
  
  
 
===Uso dei ''Puntatori''===
 
===Uso dei ''Puntatori''===
 
Questa modalità prevede la lettura dell'area di memoria puntata dalla variabile stringa contenente la lettera localizzata:
 
Questa modalità prevede la lettura dell'area di memoria puntata dalla variabile stringa contenente la lettera localizzata:
  '''Public''' Sub Main()   
+
  Public Sub Main()   
 
    
 
    
 
  <FONT Color=gray>' ''Immagazziniamo i valori che compongono la lettera "è" nella memoria mediante il suo assegnamento in una coerente variabile di tipo Stringa:''</font>
 
  <FONT Color=gray>' ''Immagazziniamo i valori che compongono la lettera "è" nella memoria mediante il suo assegnamento in una coerente variabile di tipo Stringa:''</font>
Riga 60: Riga 60:
 
   Free(p)   
 
   Free(p)   
 
   
 
   
  '''End'''
+
  End
  
  
Riga 68: Riga 68:
 
Questa modalità prevede un uso del tutto inusuale della funzione di dereferenziazione "Pointer@()", utilizzata solitamente per dereferenziare un ''Puntatore a Puntatore'': nel suo unico argomento verrà posta la variabile di tipo Stringa contenente la lettera localizzata.
 
Questa modalità prevede un uso del tutto inusuale della funzione di dereferenziazione "Pointer@()", utilizzata solitamente per dereferenziare un ''Puntatore a Puntatore'': nel suo unico argomento verrà posta la variabile di tipo Stringa contenente la lettera localizzata.
 
<BR>Ciò nella considerazione che la variabile di tipo Stringa punta essa stessa ad un'area di memoria.
 
<BR>Ciò nella considerazione che la variabile di tipo Stringa punta essa stessa ad un'area di memoria.
  '''Public''' Sub Main()
+
  Public Sub Main()
 
   
 
   
 
   Dim car, s, s1, s2 As String
 
   Dim car, s, s1, s2 As String
Riga 87: Riga 87:
 
   Print Chr(Val("&" & s1)) & Chr(Val("&" & s2))
 
   Print Chr(Val("&" & s1)) & Chr(Val("&" & s2))
 
   
 
   
  '''End'''
+
  End
  
  
Riga 93: Riga 93:
 
=Note=
 
=Note=
 
[1] Vedere anche la seguente pagina della Wiki:
 
[1] Vedere anche la seguente pagina della Wiki:
<BR>* [[Conversione di due valori, costituenti un carattere speciale, nella sua rappresentazione grafica]]
+
* [[Conversione di due valori, costituenti un carattere speciale, nella sua rappresentazione grafica]]

Versione attuale delle 18:29, 28 giu 2024

Come è noto, ogni carattere ASCII che ha un codice da 0 a 127 occupa un byte, invece set di caratteri come UTF-8 con lettere localizzate del tipo "à", "è", "é", "ì", "ò", "ù" e simili richiedono due o più valori del codice ASCII esteso. [nota 1]

E' possibile individuare tali valori costituenti le lettere localizzate mediante almeno quattro modalità.


Uso di un Vettore di tipo Byte[]

Questa modalità è molto semplice. Facciamo un esempio con una lettera costituita da due caratteri:

Public Sub Main()  
     
 Dim s As String = "è"  
 Dim bb As Byte[]  
     
' Carichiamo in un Vettore di tipo "Byte[]" tutti i valori che compongono e rappresentano il carattere contenuto nella variabile di tipo "String":
 bb = Byte[].FromString(s)  
          
' Quindi li vediamo nella console:
 Print Hex(bb[0]), Hex(bb[1])  
     
' Procediamo con la controprova:
 Print Chr(bb[0]); Chr(bb[1])  
     
End


Uso della funzione "Asc()"

Anche quest'altra modalità è abbastanza breve:

Public Sub Main()  
 
 Print Hex(Asc("è", 1)), Hex(Asc("è", 2))
 
' Procediamo con la controprova:
 Print Chr(Asc("è", 1)); Chr(Asc("è", 2))
 
End


Uso dei Puntatori

Questa modalità prevede la lettura dell'area di memoria puntata dalla variabile stringa contenente la lettera localizzata:

Public Sub Main()  
 
' Immagazziniamo i valori che compongono la lettera "è" nella memoria mediante il suo assegnamento in una coerente variabile di tipo Stringa:
 Dim p As Pointer  
 Dim b1, b2 As Byte

' Generiamo una variabile di tipo Puntatore che punta a un'area di memoria contenente i valori costituenti la lettera localizzata "è":
 p = Alloc("è")
    
' Leggiamo il 1° byte dell'area di memoria puntata dal Puntatore e la mostriamo in console:
 b1 = Byte@(p)
 Print Hex(b1);; 
 
' Leggiamo il 2° byte dell'area di memoria puntata dal Puntatore e la mostriamo in console:
 b2 = Byte@(p + 1) 
 Write Hex(b2)
 Print

' Vediamo in console il combinato risultato delle due letture:
 Print Chr(b1); Chr(b2)

 Free(p)  

End


Usando una funzione di dereferenziazione sulla variabile di tipo Stringa

Mostriamo anche questa quarta modalità, che pur essendo la più breve, restituisce però un risultato da ripulire da alcuni dati che non interessano ai nostri fini, e quindi è da interpretare.

Questa modalità prevede un uso del tutto inusuale della funzione di dereferenziazione "Pointer@()", utilizzata solitamente per dereferenziare un Puntatore a Puntatore: nel suo unico argomento verrà posta la variabile di tipo Stringa contenente la lettera localizzata.
Ciò nella considerazione che la variabile di tipo Stringa punta essa stessa ad un'area di memoria.

Public Sub Main()

 Dim car, s, s1, s2 As String
 
 car = "è"

 s = Pointer@(car)
  
' Il risultato è costituito dall'indirizzo di memoria della stringa di valori ed alla fine, a destra, dai valori che cerchiamo.
' I  valori costituenti la lettera "è" sono posti in un ordine inverso, ossia così:  A8C3. Quindi raccogliamo le ultime 4 lettere.
 s = Right(s, 4)
  
' Poiché è necessario invertire i due valori esadecimali, si raccoglieranno delle quattro lettere dapprima le ultime due, poi le prime due:
 s1 = Right(s, 2)
 s2 = Left(s, 2)
  
' Si trasformerà dunque ciascuna coppia di lettere nel corrispondente valore decimale, ottenendo così la lettera localizzata "è":
 Print Chr(Val("&" & s1)) & Chr(Val("&" & s2))

End


Note

[1] Vedere anche la seguente pagina della Wiki: