[Index Software] Coin des développeurs :]

Pour les gens qui ont simplement envie de discuter sans souhaiter faire passer d'information particulière.
Message
Auteur
Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#271 Message par Bubu » vendredi 24 juin 2016 à 15:25

Non, moi j'y connais rien ! :mrgreen:
Peut-être faudrait-il préciser quand même le langage de l'API que tu recherches, non ? :innocent:
:kiss:
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Tugdual
Modérateur
Messages : 40295
Enregistré le : jeudi 15 novembre 2012 à 0:13
Localisation : Nord-44
Contact :

Re: Coin des développeurs :]

#272 Message par Tugdual » vendredi 24 juin 2016 à 20:08

Bubu a écrit :Peut-être faudrait-il préciser quand même le langage de l'API que tu recherches, non ? :innocent:
Pas forcément ...

Mon questionnement de fond concerne le codage des
chaines de caractères, particulièrement en Unicode,
dans les APIs des systèmes d'exploitations (ce qui,
je l'espère, est à peu près normalisé dans les APIs) ...

Quelqu'un habitué à utiliser ces APIs me ferait gagner
du temps. De ce que j'ai pu voir dans mes premières
recherches, Linux gère ses chaines en UTF8, tandis
que Windows les gère en UTF16 (little endian ?) ...

Ça reste à confirmer. Mais ça s'annonce sportif pour
faire évoluer une vieille bibliothèque de chaines à
l'ancienne en version Unicode bi-plateforme ...
TCS = trouble de la communication sociale (24/09/2014).

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#273 Message par Bubu » vendredi 24 juin 2016 à 20:14

Tugdual a écrit : Quelqu'un habitué à utiliser ces APIs me ferait gagner
du temps.
Eh bien malheureusement, ce ne sera pas moi. :mrgreen:
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Tugdual
Modérateur
Messages : 40295
Enregistré le : jeudi 15 novembre 2012 à 0:13
Localisation : Nord-44
Contact :

Re: Coin des développeurs :]

#274 Message par Tugdual » vendredi 24 juin 2016 à 20:34

Tant pis ...

:innocent:
TCS = trouble de la communication sociale (24/09/2014).

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#275 Message par Bubu » dimanche 17 juillet 2016 à 10:06

Tip of the day :
le type 'char' en C et C++ est codé sur un octet, 8 bits.
le type 'char' en Java est codé sur 2 octets, 16 bits.
Bref....

Vous savez ce qu'il y a de pire quand on programme pour Android ?
Non, ce n'est pas le fait que les tailles d'écrans sont arbitraires. (C'est embêtant mais on exprime tout en rapports de tailles d'écran, c'est tout. :innocent: )
Même pas le fait qu'il y a un nombre incalculable de 'périphériques'. :innocent:

C'est d'utiliser Android Studio ! :twisted: Je n'avais encore jamais vu un IDE qui rame tant.


Sinon.... j'ai une vraie question :
Connaissez vous un format de fichier que Java peut lire en mode texte qui puisse représenter tout texte, de toute langue ? (Même hors de notre alphabet latin)
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Benoit
Intarissable
Messages : 8889
Enregistré le : lundi 28 septembre 2009 à 13:55
Localisation : オルセー
Contact :

Re: Coin des développeurs :]

#276 Message par Benoit » jeudi 21 juillet 2016 à 17:44

Je ne pratique pas ce langage. En général la sélection de l'encodage de caractère appliqué à un programme est gérable par la modification des propriétés régionales, en tout cas c'est comme ça qu'on fait chez les gens sérieux. :mrgreen:
Identifié Aspie (広島, 08/10/31) Diagnostiqué (CRA MP 2009/12/18)

話したい誰かがいるってしあわせだ

Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#277 Message par Bubu » jeudi 21 juillet 2016 à 20:52

Merci pour ta réponse. Disons que je ne suis pas sérieux, alors. :innocent:
Pour l'instant j'ai un fichier utf8 qui contient le français, l'anglais et l'espagnol.
Je veux juste connaître un codage de caractères qui puisse représenter toutes les langues.
(Je me dis que ça existe car les 'char' en Java sont sur 16 bits .... plus de 65.000 caractères codables)
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Ixy
Prolifique
Messages : 4667
Enregistré le : jeudi 20 mars 2014 à 20:59
Localisation : 92

Re: Coin des développeurs :]

#278 Message par Ixy » jeudi 21 juillet 2016 à 20:56

Je n'ai pas de diagnostic /!\
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#279 Message par Bubu » jeudi 21 juillet 2016 à 21:14

Ixy a écrit :Ben unicode non ?


https://fr.wikipedia.org/wiki/Unicode
Oui :lol: , je crois que c'est ça que je cherchais ! Merci !
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Benoit
Intarissable
Messages : 8889
Enregistré le : lundi 28 septembre 2009 à 13:55
Localisation : オルセー
Contact :

Re: Coin des développeurs :]

#280 Message par Benoit » jeudi 21 juillet 2016 à 22:22

Il me semble qu'une appli unicode charge en memoire beaucoup trop de trucs pour un usage simple (si 2 bytes suffisent)

C'est encore pire pour les langues basees sur les ideogrammes mais qui n'en exploitent pas un quart.

Ceci dit, il y a peut etre des optimisations.
Identifié Aspie (広島, 08/10/31) Diagnostiqué (CRA MP 2009/12/18)

話したい誰かがいるってしあわせだ

Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.

Avatar du membre
Tugdual
Modérateur
Messages : 40295
Enregistré le : jeudi 15 novembre 2012 à 0:13
Localisation : Nord-44
Contact :

Re: Coin des développeurs :]

#281 Message par Tugdual » vendredi 22 juillet 2016 à 0:26

Les normes UTF-8, UTF-16 et UTF-32 se contentent
d'encoder de l'UNICODE (basé sur l'ISO-10646), et
permettent de prendre en compte 0x110000 caractères
(17 plans de 16 bits), soit tous les caractères possibles.

Donc attention : tout caractère ne tient pas sur 16 bits,
puisque certains peuvent être codés sur jusqu'à 20+1 bits.

De plus, ces normes ne codent pas les caractères, mais
des "points de code", qui peuvent représenter aussi bien
des caractères que des morceaux de caractères, voire des
informations non affichables (par exemple la ligature).

Un caractère affichable (genre caractère accentué)
peut en outre avoir plusieurs codages possibles,
ce qui complique les comparaisons et les tris ...
Pour y remédier, la norme UNICODE propose
plusieurs formes de normalisation de ces codages ...

Enfin, les polices de caractères gèrent très rarement
tous les points de codes définis dans ces normes ...

Bref, la gestion de chaines n'est plus si simple ...
TCS = trouble de la communication sociale (24/09/2014).

Avatar du membre
Ixy
Prolifique
Messages : 4667
Enregistré le : jeudi 20 mars 2014 à 20:59
Localisation : 92

Re: Coin des développeurs :]

#282 Message par Ixy » vendredi 22 juillet 2016 à 0:52

On peut même dire que c'est un cauchemar :o


C'est comme Python qui ne veut pas fonctionner sur mon ordi car il y a un caractère spécial dans mon nom d'utilisateur :hotcry: Comme c'est stupide
Je n'ai pas de diagnostic /!\
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#283 Message par Bubu » vendredi 22 juillet 2016 à 8:45

Oui ça à l'air d'être l'horreur bien comme il faut .... :innocent:
Sinon, je pensais à coder le texte dans un fichier xml plutôt que dans un texte brut. Tout caractère devrait être codable, non ?
Qu'en pensez-vous ?
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Avatar du membre
Tugdual
Modérateur
Messages : 40295
Enregistré le : jeudi 15 novembre 2012 à 0:13
Localisation : Nord-44
Contact :

Re: Coin des développeurs :]

#284 Message par Tugdual » vendredi 22 juillet 2016 à 9:36

Bubu a écrit :Sinon, je pensais à coder le texte dans un fichier xml plutôt que dans un texte brut. Tout caractère devrait être codable, non ?
Tout caractère UNICODE est codable par
les normes UTF-8, 16 et 32, c'est même
exactement pour ça qu'elles ont été conçues ...
Note tant que j'y pense : gaffe en UTF-16,
il y a deux normes (Little et Big Indian).

C'est juste qu'on a définitivement perdu
l'ancienne correspondance bien pratique
"un caractère" = "un octet (ou un mot)",
pour passer à "un caractère" = "un nombre
variable de points de codes de 8 à 20+1 bits
" ...

Ce n'est pas gênant au niveau du stockage,
(que ce soit en mémoire ou dans un fichier)
mais c'est plus compliqué pour toutes les
opérations de plus haut niveau (comparaison
et tri en tête), et même pour l'affichage ...

C'est d'ailleurs pour gérer cette complexité
que le norme UNICODE ajoute des règles à
la norme sur laquelle elle s'appuie (ISO-10646).

En fait, je ne vois pas ce qui te pose soucis ...

Ainsi :
Bubu a écrit :Pour l'instant j'ai un fichier utf8 qui contient le français, l'anglais et l'espagnol.
Ok.
Bubu a écrit :Je veux juste connaître un codage de caractères qui puisse représenter toutes les langues.
Tu es en UTF-8 : c'est donc le cas.

Où est le problème ?
TCS = trouble de la communication sociale (24/09/2014).

Avatar du membre
Bubu
Intarissable
Messages : 7738
Enregistré le : dimanche 19 mai 2013 à 12:03
Localisation : En haut à gauche

Re: Coin des développeurs :]

#285 Message par Bubu » vendredi 22 juillet 2016 à 9:44

Tugdual a écrit : Où est le problème ?
Au fait, merci pour tes 2 réponses très détaillées.
Je crois que le problème, c'est que j'y comprends et connais rien ....
Moi à part l'ASCII ..... :oops:
Si tu me le permets je te MP plutôt pour continuer, à moins que ce soit un sujet intéressant ?
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"

Répondre