public marks

PUBLIC MARKS with tags utf-8 & encodage


PHP et UTF-8

by astrochoupe
Un article très complet sur la problématique de l'encodage des caractères en PHP et avec les systèmes adjacents : MySQL, filesystem, HTTP...


Official Google Blog: Unicode nearing 50% of the web

by srcmax (via)

About 18 months ago, we published a graph showing that Unicode on the web had just exceeded all other encodings of text on the web. The growth since then has been even more dramatic.


Comment convertir une DB de latin1 à UTF8 | MySQL

by dzc & 1 other (via)
J’ai utilisé cette technique pour convertir une base de données de 115Go et tout c’est bien déroulé. L’astuce consiste à transformer les chaines de caractères à un format binaire, pour ensuite les reconvertir en UTF8. Il faut cependant ne pas négliger un aspect lors de cette conversion. Les caractères Latin1 utilise 1 byte par caractère alors qu’un caractère UTF8 utilisent 3 bytes par caractère. Si l’espace disque est une de vos contraintes, il ne faut pas prendre cette conversion à la légère!

Changer de jeu de caractères pour UTF-8 -

by srcmax & 2 others (via)
Préparer l’internationalisation d’un site n’est pas une opération triviale, car dans la plupart des cas, elle nécessite de passer d’un jeu de caractères à un autre. Or, un site Web résulte d’un assemblage de plusieurs logiciels, où les questions de jeux de caractères apparaissent à chaque niveau. Cet article résume les différents points de la configuration d’un site « classique » dans le cadre de l’utilisation d’UTF-8.


utf-8 Growth On The Web - W3C Q&A Weblog

by julie & 2 others

On Google's blog, Mark Davis is explaining that Google is moving to Unicode 5.1. The article unfortunately mixes unicode and utf-8 as it has been noticed by David Goodger in Unicode misinformation. But the really interesting bit is the growth of utf-8 on the Web. These data should be interesting for the development of http, html 5 and validators.


UTF-8 - HTML Purifier

by hobbes
Character encoding and character sets, in truth, are not that difficult to understand. But if you don't understand them, you are going to be caught by surprise by some of HTML Purifier's behavior, namely the fact that it operates UTF-8 or the limitations of the character encoding transformations it does. This document will walk you through determining the encoding of your system and how you should handle this information. It will stay away from excessive discussion on the internals of character encoding.

2006 - Introduction aux jeux de caractères

by srcmax & 3 others (via)
Qu'est-ce qu'un jeu de caractères ? Quelle est la différence entre ISO-8859-1, UTF-8 et Windows-1252 ? Steve Frécinaux nous présente les différents jeux de caractères.

PUBLIC TAGS related to tag utf-8

font +   forum +   gtk+ +   linux +   player +   unicode +   xmms +   亂碼 +   字型 +  

Active users

last mark : 17/04/2012 08:01

last mark : 29/01/2010 10:57

last mark : 28/08/2009 14:02

last mark : 18/02/2009 12:41

last mark : 04/07/2008 17:37

last mark : 29/05/2008 19:33

last mark : 07/05/2008 13:50

last mark : 18/04/2007 21:52

last mark : 07/02/2007 22:34