dos2unix(1) 2024-01-22 dos2unix(1) NAMN dos2unix - konverterare for textfilsformat fran DOS/Mac till Unix och vice versa SYNOPSIS dos2unix [flaggor] [FIL ] [-n INFIL UTFIL ] unix2dos [flaggor] [FIL ] [-n INFIL UTFIL ] BESKRIVNING Paketet Dos2unix inkluderar verktygen "dos2unix" och "unix2dos" som konverterar oformaterade textfiler i DOS- eller Mac-format till Unix- format och vice versa. Textfiler i DOS/Windows har en radbrytning, ocksa kand som nyrad, som ar en kombination av tva tecken: vagnretur (Carriage Return, CR) atfoljt av radmatning (Line Feed, LF). Textfiler i Unix har en radbrytning som ar ett enda tecken: radmatning (Line Feed, LF). Textfiler for Mac, innan Mac OS X, hade en radbrytning som var en enda vagnretur (Carriage Return, CR). Numera anvander Mac OS radbrytning i Unix-stil (LF). Forutom radbrytningar sa kan Dos2unix ocksa konvertera filers kodning. Nagra DOS-teckentabeller kan konverteras till Unix Latin-1. Och filer som anvander Windows Unicode (UTF-16) kan konverteras till Unix Unicode (UTF-8). Binara filer hoppas over automatiskt, om inte konvertering tvingas. Kataloger och FIFOs och andra filer som inte ar vanliga filer hoppas over automatiskt. Symboliska lankar och deras mal forblir oforandrade som standard. Symboliska lankar kan valfritt bli ersatta eller sa kan utmatningen skrivas till malet for den symboliska lanken. Pa Windows saknas stod for att skriva till malet for en symbolisk lank. Dos2unix modellerades efter dos2unix fran SunOS/Solaris. Det finns en viktig skillnad gentemot originalversionen for SunOS/Solaris. Denna versionen gor som standard konverteringen pa plats (gammalfilslage), medan originalversionen fran SunOS/Solaris bara hade stod for parad konvertering (nyfilslage). Se vidare flaggorna "-o" och "-n". En annan skillnad ar att SunOS/Solaris-versionen som standard anvander iso-lageskonvertering medan denna version som standard anvander ascii-lageskonvertering. FLAGGOR -- Behandla alla efterfoljande flaggor som filnamn. Anvand denna flagga om du vill konvertera filer vars namn borjar med bindestreck. For att till exempel konvertera en fil med namnet "-foo" kan du anvanda detta kommando: dos2unix -- -foo Eller i nyfilslage: dos2unix -n -- -foo out.txt --allow-chown Tillat andring av agarskap for fil i gammalt fillage. Nar denna flagga anvands, kommer konverteringen inte att avbrytas nar anvandar- och/eller gruppagarskap for originalfilen inte kan bevaras i gammalt fillaget. Konverteringen kommer att fortsatta och den konverterade filen kommer att fa samma nya agarskap som om den konverterades i nyfilslage. Se ocksa flaggorna "-o" och "-n". Denna flagga ar endast tillganglig om dos2unix har stod for att bevara anvandar- och gruppagarskap for filer. -ascii Standardkonverteringslage. Se vidare stycket KONVERTERINGSLAGEN. -iso Konvertering mellan DOS- och ISO-8859-1-teckentabeller. Se vidare stycket KONVERTERINGSLAGEN. -1252 Anvand Windows-teckentabell 1252 (Vasteuropeisk). -437 Anvand DOS-teckentabell 437 (USA). Detta ar standardteckentabellen som anvands for ISO-konvertering. -850 Anvand DOS-teckentabell 850 (Vasteuropeisk). -860 Anvand DOS-teckentabell 860 (Portugisisk). -863 Anvand DOS-teckentabell 863 (Fransk-kanadensisk). -865 Anvand DOS-teckentabell 865 (Nordisk). -7 Konvertera 8-bitars tecken till 7-bitars blanksteg. -b, --keep-bom Behall byteordningsmarkering (Byte Order Mark, BOM). Om infilen har en BOM, skriv en BOM i utfilen. Detta ar standardbeteendet vid konvertering av DOS-radbrytningar. Se vidare flaggan "-r". -c, --convmode KONVERTERINGSLAGE Staller in konverteringslage. Dar KONVERTERINGSLAGE ar en av: ascii, 7bit, iso, mac dar ascii ar standard. -D, --display-enc KODNING Stall in kodning for visad text. Dar KODNING ar en av: ansi, unicode, unicodebom, utf8, utf8bom dar ansi ar standardvalet. Denna flagga finns bara tillganglig i dos2unix for Windows med stod for Unicode-filnamn. Denna flagga har ingen effekt pa sjalva filnamnen som lases och skrivs, bara pa hur de visas. Det finns flera metoder for att visa text i en Windows-konsol baserad pa vilken kodning texten har. De har alla for- och nackdelar. ansi Dos2unix standardmetod ar att anvanda ANSI-kodad text. Fordelen ar att den ar bakatkompatibel. Det fungerar med raster- och TrueType-teckensnitt. I vissa regioner kan du behova andra den aktiva DOS OEM-teckentabellen till Windows-systemets ANSI- teckentabell genom att anvanda kommandot "chcp", eftersom dos2unix anvander Windows-systemets teckentabell. Nackdelen med ansi ar att internationella filnamn med tecken som inte finns i systemets standardteckentabell inte visas korrekt. Du kommer att se fragetecken, eller en felaktig symbol istallet. Nar du inte arbetar med utlandska filnamn ar denna metoden OK. unicode, unicodebom Fordelen med unicode-kodning (Windows-namnet for UTF-16) ar att text vanligtvis visas korrekt. Det finns inget behov av att andra den aktiva teckentabellen. Du kan behova stalla in konsolens teckensnitt till ett TrueType-teckensnitt for att fa internationella tecken att visas korrekt. Nar ett tecken inte finns inkluderat i TrueType-teckensnittet kommer du vanligtvis att se en liten ruta, ibland med ett fragetecken inuti. Nar du anvander ConEmu-konsolen kommer all text att visas korrekt eftersom ConEmu automatiskt valjer ett bra teckensnitt. Nackdelen med unicode ar att den inte ar kompatibel med ASCII. Utmatningen ar inte latt att hantera nar du omdirigerar den till ett annat program eller en fil. Nar metod "unicodebom" anvands kommer Unicode-texten att foregas av en BOM (byteordningsmarkering, Byte Order Mark). En BOM kravs for korrekt omdirigering eller rorledning i PowerShell. utf8, utf8bom Fordelen med utf8 ar att den ar kompatibel med ASCII. Du maste stalla in konsolens teckensnitt till ett TrueType-teckensnitt. Med ett TrueType-teckensnitt kommer text att visas pa liknande satt som med "unicode"-kodningen. Nackdelen ar att nar du anvander standardrasterteckensnittet kommer alla icke-ASCII tecken att visas fel. Inte enbart unicode-filnamn, utan ocksa oversatta meddelanden kommer att bli olasbara. Under Windows som konfigurerats for Ostasien kan man komma att se manga blinkningar i konsolen nar meddelanden visas. I ConEmu-konsolen fungerar utf8-kodningsmetoden val. Nar metod "utf8bom" anvands kommer UTF-8-texten att foregas av en BOM (byteordningsmarkering, Byte Order Mark). En BOM kravs for korrekt omdirigering eller rorledning i PowerShell. Standardkodningen kan andras via miljovariabeln DOS2UNIX_DISPLAY_ENC genom att satta den till "unicode", "unicodebom", "utf8" or "utf8bom". -e, --add-eol Lagg till en radbrytning pa sista raden om det inte finns nagon. Detta fungerar for alla konverteringar. En fil konverterad fran DOS- till Unix-format kan sakna en radbrytning pa sista raden. Det finns textredigerare som skriver textfiler utan en radbrytning pa den sista raden. Vissa Unix- program har problem med att behandla dessa filer, da POSIX- standarden definierar det som att varje rad i en textfil maste har ett avslutande nyradstecken. Att konkatenera filer kan till exempel ge ovantat resultat. -f, --force Tvinga konvertering av binara filer. -gb, --gb18030 Under Windows konverteras UTF-16-filer som standard till UTF-8, oavsett vilken lokalinstallning som ar gjord. Anvand denna flagga for att konvertera UTF-16-filer till GB18030. Denna flagga finns bara tillganglig i Windows. Se vidare i avsnittet GB18030. -h, --help Visa hjalptext och avsluta. -i[FLAGGOR], --info[=FLAGGOR] FIL ... Visa filinformation. Ingen konvertering gors. Foljande information skrivs ut, i denna ordningen: antal DOS- radbrytningar, antal Unix-radbrytningar, antal Mac-radbrytningar, byteordningsmarkeringen, text eller binar, filnamn. Exempelutmatning: 6 0 0 no_bom text dos.txt 0 6 0 no_bom text unix.txt 0 0 6 no_bom text mac.txt 6 6 6 no_bom text mixed.txt 50 0 0 UTF-16LE text utf16le.txt 0 50 0 no_bom text utf8unix.txt 50 0 0 UTF-8 text utf8dos.txt 2 418 219 no_bom binar dos2unix.exe Notera att en binarfil ibland kan misstas for en textfil. Se vidare flaggan "-s". Om dessutom flaggan "-e" eller "--add-eol" anvands sa kommer aven den radbrytning som anvands pa sista raden att skrivas ut, eller "noeol" om det inte finns nagon. Exempelutmatning: 6 0 0 no_bom text dos dos.txt 0 6 0 no_bom text unix unix.txt 0 0 6 no_bom text mac mac.txt 1 0 0 no_bom text noeol noeol_dos.txt Extra flaggor kan anvandas valfritt for att andra utmatningen. En eller fler flaggor kan laggas till. 0 Skriv ut filinformationsraderna foljt av ett null-tecken istallet for ett nyradstecken. Detta mojliggor korrekt tolkning av filnamn med blanksteg eller citationstecken nar c-flaggan anvands. Anvand denna flagga i kombination med xargs(1):s flagga "-0" eller "--null". d Skriv ut antal DOS-radbrytningar. u Skriv ut antal Unix-radbrytningar. m Skriv ut antal Mac-radbrytningar. b Skriv ut byteordningsmarkeringen. t Skriv ut om filen ar text eller binar. e Skriv ut radbrytningstypen pa sista raden, eller "noeol" om det inte finns nagon. c Skriv bara ut filerna som skulle ha konverterats. Med "c"-flaggan kommer dos2unix att skriva ut filerna som innehaller DOS-radbrytningar, unix2dos kommer bara att skriva ut filnamn som har Unix-radbrytningar. Om dessutom flaggan "-e" eller "--add-eol" anvands sa kommer aven filer som saknar en radbrytning pa sista raden att skrivas ut. h Skriv ut rubrik. p Visa filnamn utan sokvag. Exempel: Visa information for alla *.txt-filer: dos2unix -i *.txt Visa bara antalet DOS-radbrytningar och Unix-radbrytningar: dos2unix -idu *.txt Visa bara byteordningsmarkeringen: dos2unix --info=b *.txt Lista filerna som har DOS-radbrytningar: dos2unix -ic *.txt Lista filerna som har Unix-radbrytningar: unix2dos -ic *.txt Lista filerna som har DOS-radbrytningar eller saknar en radbrytning pa sista raden: dos2unix -e -ic *.txt Konvertera endast filer som har DOS-radbrytningar och lamna ovriga filer ororda: dos2unix -ic0 *.txt | xargs -0 dos2unix Hitta textfiler som har DOS-radbrytningar: find -name '*.txt' -print0 | xargs -0 dos2unix -ic -k, --keepdate Behall infilens datumstampel for utfilen. -L, --license Visa programmets licens. -l, --newline Lagg till ytterligare nyrad. dos2unix: Endast DOS-radbrytningar andras till tva Unix- radbrytningar. I Mac-lage andras endast Mac-radbrytningar till tva Unix-radbrytningar. unix2dos: Endast Unix-radbrytningar andras till tva DOS- radbrytningar. I Mac-lage andras Unix-radbrytningar till tva Mac- radbrytningar. -m, --add-bom Skriv en byteordningsmarkering (Byte Order Mark, BOM) i utfilen. Som standard skrivs en UTF-8 BOM. Nar infilen ar UTF-16, och flaggan "-u" anvands, kommer en UTF-16 BOM att skrivas. Anvand aldrig denna flagga nar kodningen for utmatning ar nagot annat an UTF-8, UTF-16 eller GB18030. Se vidare i avsnittet UNICODE. -n, --newfile INFIL UTFIL Nyfilslage. Konvertera filen INFIL och skriv utfilen UTFIL. Filnamnen maste ange i par och jokertecken i namnen ska inte anvandas annars kommer du att forlora filer. Anvandaren som paborjar konverteringen i nyfilslage (parat lage) kommer att bli agaren till den konverterade filen. Las-/skrivbehorigheter for den nya filen kommer att vara samma behorigheter som for originalfilen minus umask(1) for anvandaren som kor konverteringen. --no-allow-chown Tillat inte andring av agarskap i gammalt fillage (standard) Avbryt konvertering nar anvandar- och/eller gruppagarskap for originalfilen inte kan bevaras i gammalt fillage. Se ocksa flaggorna "-o" och "-n". Denna flagga ar endast tillganglig om dos2unix har stod for att bevara anvandar- och gruppagarskap for filer. --no-add-eol Lagg inte till en radbrytning pa den sista raden om det inte finns nagon. -O, --to-stdout Skriv till standard ut som ett Unix-filter. Anvand flaggan "-o" for att aterga till det gamla (pa-plats) fillaget. Kombinerat med flaggan "-e" kan filer konkateneras korrekt. Inga sammanfogade sista och forsta rader, och inga Unicode byteordningsmarkeringar i mitten pa den konkatenerade filen. Exempel: dos2unix -e -O fil1.txt fil2.txt > ut.txt -o, --oldfile FIL Gammalfilslage. Konvertera filen FIL och skriv over den med utmatningen. Programmet kor i detta lage som standard. Jokertecken i filnamn far anvandas. I gammalfilslage (pa-plats lage) kommer den konverterade filen att fa samma agare, grupp samt las-/skrivbehorigheter som originalfilen. Aven da filen konverteras av en annan anvandare som har skrivbehorighet for filen (t.ex. anvandaren root). Konverteringen kommer att avbrytas nar det inte ar mojligt att bevara originalvardena. Byte av agare skulle kunna innebara att originalagaren inte langre kan lasa filen. Byte av grupp skulle kunna vara en sakerhetsrisk, filen skulle kunna bli lasbar for anvandare som den inte ar avsedd for. Stod for bevarande av agare, grupp och las-/skrivbehorigheter finns bara i Unix. For att kontrollera om dos2unix har stod for att bevara anvandar- och gruppagarskap for filer skriv "dosunix -V". Konvertering gors alltid via en temporarfil. Nar ett fel intraffar halvvags i konverteringen tas den temporara filen bort och originalfilen finns kvar intakt. Om konverteringen ar framgangsrik kommer originalfilen att ersattas med temporarfilen. Du kanske har skrivrattigheter till originalfilen men inte rattigheter att stalla in samma anvandar- och/eller grupprattighetsegenskaper pa temporarfilen som originalfilen har. Detta innebar att du inte kan bevara anvandar- och/eller gruppagarskapet for originalfilen. I detta fall kan du anvanda flaggan "--allow-chown" for att fortsatta konverteringen: dos2unix --allow-chown foo.txt Ett annat alternativ ar att anvanda nyfilslage: dos2unix -n foo.txt foo.txt Fordelen med flaggan "--allow-chown" ar att du kan anvanda jokertecken och att agarskapsegenskaper om mojligt kommer att bevaras. -q, --quiet Tyst drift. Undertryck alla varningar och meddelanden. Returvardet ar noll. Utom nar felaktiga kommandoradsflaggor anvands. -r, --remove-bom Ta bort byteordningsmarkering (Byte Order Mark, BOM). Skriv inte en BOM i utfilen. Detta ar standardbeteende vid konvertering av Unix- radbrytningar. Se vidare flaggan "-b". -s, --safe Hoppa over binara filer (standard). Binarfiler hoppas over for att undvika oavsiktliga misstag. Var medveten om att detektering av binarfiler inte ar 100% saker. Infiler genomsoks efter binara symboler som typiskt inte aterfinns i textfiler. Det ar mojligt att en binarfil enbart innehaller texttecken. En sadan binarfil kommer oavsiktligt att ses som en textfil. -u, --keep-utf16 Behall infilens original UTF-16-kodning. Utfilen kommer att skrivas med samma UTF-16-kodning som infilen, omvand eller rak byteordning (little eller big endian). Detta forhindrar transformation till UTF-8. En UTF-16 BOM kommer att skrivas i enlighet med detta. Denna flagga kan inaktiveras med "-ascii"-flaggan. -ul, --assume-utf16le Antag att infilsformatet ar UTF-16LE. Nar det finns en byteordningsmarkering (Byte Order Mark) i infilen sa har BOM:en hogre prioritet an denna flagga. Nar du har gjort fel antagande (infilen var inte i UTF-16LE-format) och konverteringens lyckas, kommer du att fa en UTF-8 utfil med felaktig text. Du kan gora denna konvertering ogjord med iconv(1) genom att konvertera UTF-8 utfilen tillbaka till UTF-16LE. Detta kommer att aterskapa originalfilen. Antagandet om UTF-16LE fungerar som ett konverteringslage. Genom att vaxla till standard ascii-laget kommer UTF-16LE antagandet att stangas av. -ub, --assume-utf16be Antag att infilsformatet ar UTF-16BE. Denna flagga fungerar pa samma satt som flaggan "-ul". -v, --verbose Visa utforliga meddelanden. Extra information visas om byteordningsmarkeringar och antalet konverterade radbrytningar. -F, --follow-symlink Folj symboliska lankar och konvertera malen. -R, --replace-symlink Ersatt symboliska lankar med konverterade filer (originalmalfilerna forblir oforandrade). -S, --skip-symlink Behall symboliska lankar och mal oforandrade (standard). -V, --version Visa versionsinformation och avsluta. MAC-LAGE Som standard konverteras radbrytningar fran DOS till Unix och vice versa. Mac-radbrytningar konverteras inte. I Mac-lage konverteras radbrytningar fran Mac till Unix och vice versa. DOS-radbrytningar andras ej. For att kora i Mac-lage anvand kommandoradsflaggan "-c mac" eller anvand kommandona "mac2unix" eller "unix2mac". KONVERTERINGSLAGEN ascii Detta ar standardkonverteringslaget. Detta lage anvands for att konvertera ASCII och ASCII-kompatibla kodade filer, sa som UTF-8. Att aktiveras ascii-lage inaktiverar 7bit- och iso-lage. Om dos2unix har UTF-16 stod kommer UTF-16-kodade filer att konverteras till kodningen for den aktuella lokalen pa POSIX- sytstem och till UTF-8 pa Windows. Aktivering av ascii-laget inaktiverar flaggan for att behalla UTF-16-kodning ("-u") och flaggorna for att anta UTF-16 indata ("-ul" och "-ub"). For att se om dos2unix har UTF-16-stod skriv "dox2unix -V", se ocksa avsnittet UNICODE. 7bit I detta lage konverteras alla 8-bitars icke-ASCII tecken (med varden fran 128 till 255) till ett 7-bitars blanksteg. iso Tecken konverteras mellan DOS teckenuppsattning (teckentabell) och ISO teckenuppsattning ISO-8859-1 (Latin-1) pa Unix. DOS tecken utan motsvarande ISO-8859-1 tecken, for vilka konvertering ar omojligt, kommer att ersattas med en punkt. Detsamma galler for ISO-8859-1 tecken utan motsvarighet i DOS. Nar enbart flaggan "-iso" anvands kommer dos2unix att forsoka avgora den aktiva teckentabellen. Nar detta inte ar mojligt kommer dos2unix att anvanda standardteckentabellen CP437, vilken huvudsakligen anvands i USA. For att tvinga en specifik teckentabell anvand flaggorna "-437" (USA), "-850" (Vasteuropeisk), "-860" (Portugisisk), "-863" (Fransk-kanadensisk) eller "-865" (Nordisk). Det finns ocksa stod for Windows-teckentabell CP-1252 (Vasteuropeisk) via flaggan "-1252". For andra teckentabeller anvand dos2unix i kombination med iconv(1). iconv kan konvertera mellan en lang lista av teckenkodningar. Anvand aldrig ISO-konvertering pa Unicode-textfiler. Det kommer att korrumpera UTF-8-kodade filer. Nagra exempel: Konvertera fran DOS standardteckentabell till Unix Latin-1: dos2unix -iso -n in.txt ut.txt Konvertera fran DOS CP850 till Unix Latin-1: dos2unix -850 -n in.txt ut.txt Konvertera fran Windows CP1252 till Unix Latin-1: dos2unix -1252 -n in.txt ut.txt Konvertera fran Windows CP1252 till Unix UTF-8 (Unicode): iconv -f CP1252 -t UTF-8 in.txt | dos2unix > ut.txt Konvertera fran Unix Latin-1 till DOS-standardteckentabell: unix2dos -iso -n in.txt ut.txt Konvertera fran Unix Latin-1 till DOS CP850: unix2dos -850 -n in.txt ut.txt Konvertera fran Unix Latin-1 till Windows CP1252: unix2dos -1252 -n in.txt ut.txt Konvertera fran Unix UTF-8 (Unicode) till Windows CP1252: unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > ut.txt Se aven och . UNICODE Kodningar Det finns flera olika Unicode kodningar. I Unix och Linux kodas filer vanligtvis med UTF-8-kodning. I Windows kan Unicode-textfiler kodas i UTF-8, UTF-16 eller UTF-16 rak byteordning (big endian), men kodas mestadels i UTF-16-format. Konvertering Unicode-textfiler kan ha DOS, Unix eller Mac-radbrytningar precis som ASCII-textfiler. Alla versioner av dos2unix och unix2dos kan konvertera UTF-8-kodade filer, eftersom UTF-8 designades for bakatkompatibilitet med ASCII. Dos2unix och unix2dos med Unicode-UTF-16-stod, kan lasa UTF-16-kodade textfiler i omvand och rak byteordning (little och big endian). For att se om dos2unix byggts med UTF-16-stod skriv "dos2unix -V". Under Unix/Linux kommer UTF-16-kodade filer att konverteras till lokalens teckenkodning. Anvand kommandot locale(1) for att ta reda pa vilken lokalens teckenkodning ar. Nar konvertering inte ar mojlig kommer ett konverteringsfel att intraffa och filen kommer att hoppas over. Under Windows konverteras UTF-16-filer som standard till UTF-8. UTF-8-formaterade textfiler har bra stod bade under Windows och Unix/Linux. UTF-16- och UTF-8-kodning ar fullt kompatibla, ingen text kommer att ga forlorad i konverteringen. Nar ett UTF-16 till UTF-8-konverteringsfel uppstar, till exempel nar infilen i UTF-16-format innehaller ett fel, kommer att filen att hoppas over. Nar flaggan "-u" anvands kommer utfilen att skrivas med samma UTF-16-kodning som infilen. Flaggan "-u" forhindrar konvertering till UTF-8. Dos2unix och unix2dos har ingen flagga for att konvertera UTF-8-filer till UTF-16. ISO- och 7-bitarslageskonvertering fungerar inte pa UTF-16-filer. Byteordningsmarkering (Byte Order Mark) I Windows har Unicode-textfiler typiskt en byteordningsmarkering (Byte Order Mark, BOM) eftersom manga Windows-program (inklusive Notepad) lagger till BOM:ar som standard. Se aven . I Unix har Unicode-textfiler typiskt ingen BOM. Filer antas vara kodade i den lokala teckenuppsattningen. Dos2Unix kan bara detektera om en fil ar i UTF-16-format om filen har en BOM. Nar en UTF-16-fil inte har en BOM sa kommer dos2unix att de filen som en binarfil. Anvand flaggan "-ul" eller "-ub" for att konvertera en UTF-16-fil utan BOM. Dos2unix skriver som standard ingen BOM i utfilen. Med flaggan "-b" kommer Dos2unix att skriva en BOM nar infilen har en BOM. Unix2dos skriver som standard en BOM i utfilen nar infilen har en BOM. Anvand flaggan "-r" for att ta bort BOM:en. Dos2unix och unix2dos skriver alltid en BOM nar flaggan "-m" anvands. Unicode-filnamn under Windows Dos2unix har valfritt stod for lasning och skrivning av Unicode-filnamn i Windows kommandoprompt. Detta innebar att dos2unix kan oppna filer som har tecken i sina namn som inte ar en del av systemets atandard ANSI-teckentabell. For att se om dos2unix for Windows byggdes med stod for Unicode-filnamn skriv "dos2unix -V". Det finns en del problem med att visa Unicode-filnamn i en Windows- konsol. Se vidare flaggan "-D", "--display-enc". Filnamnen kan visas felaktigt i konsolen, men filerna som skrivs kommer att ha de korrekta namnen. Unicode-exempel Konvertera fran Windows UTF-16 (med BOM) till Unix UTF-8: dos2unix -n in.txt ut.txt Konvertera fran Windows UTF-16LE (utan BOM) till Unix UTF-8: dos2unix -ul -n in.txt ut.txt Konvertera fran Unix UTF-8 till Windows UTF-8 med BOM: unix2dos -m -n in.txt ut.txt Konvertera fran Unix UTF-8 till Windows UTF-16: unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > ut.txt GB18030 GB18030 ar en standard fran Kinesiska regeringen. En obligatorisk delmangd av standarden GB18030 kravs officiellt for alla programvaruprodukter som saljs i Kina. Se vidare . GB18030 ar fullstandigt kompatibel med Unicode och kan anses vara ett overforingsformat for unicode. Precis som UTF-8 ar GB18030 kompatibel med ASCII. GB18030 ar ocksa kompatibel med Windows-teckentabell 936, ocksa kand som GBK. Under Unix/Linux kommer UTF-16-filer att konverteras till GB18030 nar lokalens teckenkodning ar installd pa GB18030. Notera att detta endast kommer att fungera om lokalen har stod i systemet. Anvand kommandot "locale -a" for att fa en lista over de lokaler som stods. Under Windows maste du anvanda flaggan "-gb" for att konvertera UTF-16-filer till GB18030. GB18030-kodade filer kan ha en byteordningsmarkering, precis som Unicode-filer. EXEMPEL Lasa inmatning fran "stdin" och skriv utmatning till "stdout": dos2unix < a.txt cat a.txt | dos2unix Konvertera och ersatta a.txt. Konvertera och ersatt b.txt: dos2unix a.txt b.txt dos2unix -o a.txt b.txt Konvertera och ersatt a.txt i ascii-konverteringslage: dos2unix a.txt Konvertera och ersatt a.txt i ascii-konverteringslage, konvertera och ersatt b.txt i 7bit-konverteringslage: dos2unix a.txt -c 7bit b.txt dos2unix -c ascii a.txt -c 7bit b.txt dos2unix -ascii a.txt -7 b.txt Konvertera a.txt fran Mac- till Unix-format: dos2unix -c mac a.txt mac2unix a.txt Konvertera a.txt fran Unix- till Mac-format: unix2dos -c mac a.txt unix2mac a.txt Konvertera och ersatt a.txt medan originalet tidsstampel behalls: dos2unix -k a.txt dos2unix -k -o a.txt Konvertera a.txt och skriv till e.txt: dos2unix -n a.txt e.txt Konvertera a.txt och skriv till e.txt, lat e.txt behalla tidsstampeln fran a.txt: dos2unix -k -n a.txt e.txt Konvertera och ersatt a.txt, konvertera b.txt och skriv till e.txt: dos2unix a.txt -n b.txt e.txt dos2unix -o a.txt -n b.txt e.txt Konvertera c.txt och skriv till e.txt, konvertera och ersatt a.txt, konvertera och ersatt b.txt, konvertera d.txt och skriv till f.txt: dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt REKURSIV KONVERTERING I ett Unix-skal kan kommandona find(1) och xargs(1) anvandas for att kora dos2unix rekursivt over alla textfiler i ett katalogtrad. For att till exempel konvertera alla .txt-filer i katalogtradet under den aktuella katalogen skriv: find . -name '*.txt' -print0 |xargs -0 dos2unix Flaggan "-print0" till find(1) och motsvarande flagga "-0" till xargs(1) behovs nar det finns filer med mellanslag eller citationstecken i namnet. Annars kan dessa flaggor utelamnas. Ett annat alternativ ar att anvandas find(1) med flaggan "-exec": find . -name '*.txt' -exec dos2unix {} \; I en Windows-kommandoprompt kan foljande kommando anvandas: for /R %G in (*.txt) do dos2unix "%G" PowerShell-anvandare kan anvanda foljande kommando i Windows PowerShell: get-childitem -path . -filter '*.txt' -recurse | foreach-object {dos2unix $_.Fullname} LOKALISERING LANG Det primara spraket valjs med miljovariabeln LANG. LANG-variabeln bestar av flera delas. Den forsta delen ar sprakkoden i gemener. Den andra delen ar valfri och utgor landskoden i versaler, foregangen av ett understreck. Det finns ocksa en valfri tredje del: teckenkodning, foregangen av en punkt. Ett par exempel for skal av POSIX-standard-typ: export LANG=nl Nederlandska export LANG=nl_NL Nederlandska, Nederlanderna export LANG=nl_BE Nederlandska, Belgien export LANG=es_ES Spanska, Spanien export LANG=es_MX Spanska, Mexiko export LANG=en_US.iso88591 Engelska, USA, Latin-1-kodning export LANG=en_GB.UTF-8 Engelska, UK, UTF-8-kodning For en fullstandig lista over sprak och landskoder se vidare i gettext-manualen: Pa Unix-system kan du anvanda kommando locale(1) for att fa lokal- specifik information. LANGUAGE Med miljovariabeln LANGUAGE kan du ange en prioritetslista over sprak, separerade med kolon. Dos2unix kommer att ge foretrade till LANGAUGE over LANG. Exempelvis forst nederlandska och sedan tyska: "LANGUAGE=nl:de". Du maste forst ha aktiverat lokalisering, genom att satta LANG (eller LC_ALL) till ett varde annat an "C", innan du kan anvanda en prioritetslista for sprak via LANGUAGE-variabeln. Se vidare i gettext-manualen: Om du valjer ett sprak som inte ar tillganglig kommer du att fa engelska meddelanden som standard. DOS2UNIX_LOCALEDIR Med miljovariabeln DOS2UNIX_LOCALEDIR kan LOCALEDIR som stallts in vid kompilering asidosattas. LOCALEDIR anvands for att hitta sprakfiler. Standardvardet for GNU-program ar "/usr/local/share/locale". Flaggan --version kommer att visa vilken LOCALEDIR som anvands. Exempel (POSIX-skal): export DOS2UNIX_LOCALEDIR=$HOME/share/locale RETURVARDE Om allt gar bra kommer noll att returneras. Nar ett systemfel uppstar kommer det senaste systemfelet att returneras. For andra fel kommer 1 att returneras. Returvardet ar alltid noll i tyst lage, utom nar felaktiga kommandoradsflaggor anvands. STANDARDER FORFATTARE Benjamin Lin - , Bernd Johannes Wuebben (mac2unix-lage) - , Christian Wurll (lagg till en extra radbrytning) - , Erwin Waterlander - (upphovsman) Projektsida: SourceForge-sida: SE AVEN file(1) find(1) iconv(1) locale(1) xargs(1) dos2unix 2024-01-22 dos2unix(1)