Re: Was erzähle ich meinen Studenten zu LaTeX? 8/8



Andreas Matthias wrote, on 03/23/2008 05:59 PM:
Michael Goerz wrote:

Alles was nicht ASCII ist sollte heutzutage in Unicode (UTF-8)
geschrieben werden. Die alten Codierungen wie latin1 bereiten nur
Kopfzerbrechen beim Dateiaustausch mit Leuten die andere System
benutzen oder sich in anderen Laendern befinden. Ich geh mal davon
aus, dass inputenc genausogut mit UTF-8 umgehen kann... ich selbst
mache die Umlaute eigentlich immer in ASCII (z.B.: "o), aber das
liegt wohl vor allem daran, dass ich auf einer amerikanischen
Tastatur ohne Umlaute tippe.

Du widersprichst dir. Wenn du schon daran scheiterst, Umlaute
einzugeben, was willst du dann mit UTF8? Eine UTF8-Tastatur?
Wieso wiederspreche ich mir? Ich sage doch nur, wenn nicht ASCII, dann UTF-8 (wobei eine ASCII Datei ja automatisch auch UTF-8 ist). Was hat die Kodierung denn mit der Tastatur zu tun? Wenn man ueberhaupt Umlaute eingeben kann und die Datei in latin1 speichern kann, dann kann man sie auch in UTF-8 speichern. Der Punkt ist doch nur der, dass das Zeichen dann in der Datei eindeutig festgelegt ist, und man nicht neu codieren muss, wenn man ploetzlich feststellt, dass man ein Zeichen benoetigt, was in latin1 zufaellig nicht drin ist. Was dann? Was wenn man verschieden Sprachen innerhalb eines Projekts hat? Jede Datei in einer Codierung fuer die jeweilige Sprache?

Welche Tastatur jemand hat, ist doch voellig egal. Die meisten in dieser Newsgroup werden sicherlich eine deusche haben und gerne Umlaute eintippen. Andere Laender haben die wildesten Tastaturen, was nur etwas darueber aussagt, welche Zeichen sie direkt eintippen koennen.

Angenommen, Latex haette keinen ascii-Ersatz fuer die Umaute, dann wuerde ich wahrscheinlich immer noch ascii eintippen, und dann ein kleines Skript drueberlaufen lassen was das Ganze in den Unicode-Buchstaben verwandelt. Das ist aber nur ne Frage, wie man die Zeichen eingibt (wenn man 3000 verschiedene Chinesische Zeichen eingeben will, muss man sich auch was ueberlegen). Das hat nun nichts, aber auch gar nichts mit der Codierung der Datei zu tun!

Michael
.



Relevant Pages

  • Re: utf-8
    ... japanische zeichen habe und word diese nicht kennt, ... der Codierung. ... Ich gebe dort utf-8 ein und speichere als txt Datei. ...
    (microsoft.public.de.word)
  • Re: utf-8
    ... japanische zeichen habe und word diese nicht kennt, ... der Codierung. ... Ich gebe dort utf-8 ein und speichere als txt Datei. ...
    (microsoft.public.de.word)
  • IO
    ... ist es in Java möglich, Textdaten derart in eine Datei zu schreiben, daß die ... Zeilen nicht länger sind als 75 Zeichen. ... Der Verwendete Zeichensatz sollte ... dabei UTF-8 sein. ...
    (de.comp.lang.java)
  • Re: UTF-8-codierte Umlaute via print und warn ausgeben
    ... Interpreter nicht, dass es UTF-8 ist. ... Daher wird jedes der 15 Zeichen als ein Byte ausgegeben. ... unveraendert aufs Terminal gekippt, waehrend mit 'use utf8' fuer die ... Standardausgabe irgendwelche Magie (Umwandlung in ISO-8859-15-codierte ...
    (de.comp.lang.perl.misc)
  • Re: Delphi und UTF-8
    ... Je nach Datentyp des Strings, als Ansi in AnsiString, als Unicode ... und als UTF-8 in UTF8String. ... Unicode Zeichen kann in UTF-16 auch mal 2 WideChars belegen ... Multi-WideChar Zeichen rechnen. ...
    (de.comp.lang.delphi.misc)