The standard for internet addresses RFC 3986 allows only certain charatcers to be part of an URL: The 26 basic characters of the latin alphabet "a"–"z" in small and capital letters, the digits "0"–"9" as well as the hyphen "-", underscore "_", dot "." and tilde"~".
All other characters are part of the "reserved space" of the RFC 3986. These characters either have a special function in an URL such as dash "/" and colon ":", or they are simply not part of the URL namespace. To submit these characters in an URL, they are converted into a special format called URL encoding or percentage encoding. Instead of the character itself, its position in the Ascii charset is given, preceded by a percentage sign. Thus, a space " " will turn into %20, and the umlaut ä into %E4.
Here is a list of the typical characters that can be found in percent-encoded URLs and "garbled" E-Mails:
URL encoding | Character | Unicode |
---|---|---|
%08 | backspace |  |
%09 | tab | 	 |
%0A | line feed | 
 |
%0D | carriage return | 
 |
%20 | space |   |
%21 | ! | ! |
%22 | " | " |
%23 | # | # |
%24 | $ | $ |
%25 | % | % |
%26 | & | & |
%27 | ' | ' |
%28 | ( | ( |
%29 | ) | ) |
%2A | * | * |
%2B | + | + |
%2C | , | , |
%2D | - | - |
%2E | . | . |
%2F | / | / |
%30 | 0 | 0 |
%31 | 1 | 1 |
%32 | 2 | 2 |
%33 | 3 | 3 |
%34 | 4 | 4 |
%35 | 5 | 5 |
%36 | 6 | 6 |
%37 | 7 | 7 |
%38 | 8 | 8 |
%39 | 9 | 9 |
%3A | : | : |
%3B | ; | ; |
%3C | < | < |
%3D | = | = |
%3E | > | > |
%3F | ? | ? |
%40 | @ | @ |
%41 | A | A |
%42 | B | B |
%43 | C | C |
%44 | D | D |
%45 | E | E |
%46 | F | F |
%47 | G | G |
%48 | H | H |
%49 | I | I |
%4A | J | J |
%4B | K | K |
%4C | L | L |
%4D | M | M |
%4E | N | N |
%4F | O | O |
%50 | P | P |
%51 | Q | Q |
%52 | R | R |
%53 | S | S |
%54 | T | T |
%55 | U | U |
%56 | V | V |
%57 | W | W |
%58 | X | X |
%59 | Y | Y |
%5A | Z | Z |
%5B | [ | [ |
%5C | \ | \ |
%5D | ] | ] |
%5E | ^ | ^ |
%5F | _ | _ |
%60 | ` | ` |
%61 | a | a |
%62 | b | b |
%63 | c | c |
%64 | d | d |
%65 | e | e |
%66 | f | f |
%67 | g | g |
%68 | h | h |
%69 | i | i |
%6A | j | j |
%6B | k | k |
%6C | l | l |
%6D | m | m |
%6E | n | n |
%6F | o | o |
%70 | p | p |
%71 | q | q |
%72 | r | r |
%73 | s | s |
%74 | t | t |
%75 | u | u |
%76 | v | v |
%77 | w | w |
%78 | x | x |
%79 | y | y |
%7A | z | z |
%7B | { | { |
%7C | | | | |
%7D | } | } |
%7E | ~ | ~ |
%A2 | ¢ | ¢ |
%A3 | £ | £ |
%A5 | ¥ | ¥ |
%A6 | | | ¦ |
%A7 | § | § |
%AB | « | « |
%AC | ¬ | ¬ |
%AD | ¯ | ­ |
%B0 | º | ° |
%B1 | ± | ± |
%B2 | ª | ² |
%B4 | , | ´ |
%B5 | µ | µ |
%BB | » | » |
%BC | ¼ | ¼ |
%BD | ½ | ½ |
%BF | ¿ | ¿ |
%C0 | À | À |
%C1 | Á | Á |
%C2 | Â | Â |
%C3 | Ã | Ã |
%C4 | Ä | Ä |
%C5 | Å | Å |
%C6 | Æ | Æ |
%C7 | Ç | Ç |
%C8 | È | È |
%C9 | É | É |
%CA | Ê | Ê |
%CB | Ë | Ë |
%CC | Ì | Ì |
%CD | Í | Í |
%CE | Î | Î |
%CF | Ï | Ï |
%D0 | Ð | Ð |
%D1 | Ñ | Ñ |
%D2 | Ò | Ò |
%D3 | Ó | Ó |
%D4 | Ô | Ô |
%D5 | Õ | Õ |
%D6 | Ö | Ö |
%D8 | Ø | Ø |
%D9 | Ù | Ù |
%DA | Ú | Ú |
%DB | Û | Û |
%DC | Ü | Ü |
%DD | Ý | Ý |
%DE | Þ | Þ |
%DF | ß | ß |
%E0 | à | à |
%E1 | á | á |
%E2 | â | â |
%E3 | ã | ã |
%E4 | ä | ä |
%E5 | å | å |
%E6 | æ | æ |
%E7 | ç | ç |
%E8 | è | è |
%E9 | é | é |
%EA | ê | ê |
%EB | ë | ë |
%EC | ì | ì |
%ED | í | í |
%EE | î | î |
%EF | ï | ï |
%F0 | ð | ð |
%F1 | ñ | ñ |
%F2 | ò | ò |
%F3 | ó | ó |
%F4 | ô | ô |
%F5 | õ | õ |
%F6 | ö | ö |
%F7 | ÷ | ÷ |
%F8 | ø | ø |
%F9 | ù | ù |
%FA | ú | ú |
%FB | û | û |
%FC | ü | ü |
%FD | ý | ý |
%FE | þ | þ |
%FF | ÿ | ÿ |