Caratteri di spaziatura

Unicode include molti caratteri di spazio simili alla vista ma diversi nel comportamento tecnico.

Controlli rapidi

  • Riconosci tab, NBSP, NBSP stretto e spazio ideografico.
  • Correggi mismatch in ricerca, split e deduplicazione.
  • Normalizza gli spazi prima di indicizzare o esportare.

Unicode Inspector

Analizza testo incollato per trovare caratteri Unicode invisibili o rischiosi, visualizza i risultati e genera output pulito direttamente nel browser.

Drop .txt/.csv/.json here

or click to choose a file (max 2 MB)

Risultati

SymbolCategoriaNome UnicodeCode pointOccorrenzePosizioniActions

Nessun risultato

Nessun carattere corrispondente nell'analisi corrente.

Rilevatore di omoglifi

Rileva token con script misti e caratteri confondibili prima di fidarsi di identificatori o domini.

TokenScriptRischioConfondibiliPosizioni

Nessun rischio omoglifo rilevato.

Bidi e Trojan Source

Ispeziona le sequenze di controllo bidirezionali che possono nascondere l'ordine reale dei token in codice, configurazioni e log.

TipoRischioIntervalloNumero controlliDettagli

Nessuna sequenza bidi pericolosa rilevata.

Vista overlay

Azioni di pulizia

Output

Report JSON avanzato

Posizioni e intervalli possono aumentare la dimensione del payload.

Link condivisibile

Il testo grezzo non è mai incluso nel report o nel link condiviso.

FAQ

Perché trim non funziona uguale ovunque?

Runtime e librerie classificano i whitespace Unicode in modo non sempre uniforme.

Sostituire tutti gli spazi con uno standard è sempre corretto?

Non sempre. In alcuni contesti vanno mantenuti newline o tab.

Quando conviene normalizzare gli spazi?

Alle frontiere di ingestione, poi mantenendo un formato interno coerente.