Pro-Linux Kommentare: Schnell komprimieren mit lzop http://www.pro-linux.de Wir geben Ihrem Computer das Leben zurück de Copyright 2013, Pro-Linux Sat, 18 May 2013 21:15:27 +0200 info@pro-linux.de (Pro-Linux) info@pro-linux.de (Pro-Linux) Pro-Linux http://www.pro-linux.de/images/NB3/base/global/pl-logo_i70.png http://www.pro-linux.de Wir geben Ihrem Computer das Leben zurück Re[3]: nice http://www.pro-linux.de/artikel/2/1568/comm/512900/re3-nice.html 1. Hier geht es nicht um Parallelverarbeitung sondern um Hintergrundjobs 2. Ob 1h oder 4h ist nicht egal 3. Die Plattenzugriffe dürften mit xz (was du ja unten selbst vorschlägst) keine Rolle spielen 4. Bei nice 20 werden keine "Hochleistungszeitfenster" verschwendet 5. Threats treten hoffentlich überhaupt nicht auf http://www.pro-linux.de/artikel/2/1568/comm/512900/re3-nice.html Tue, 15 May 2012 21:41:25 +0200 Re[3]: md5sum http://www.pro-linux.de/artikel/2/1568/comm/512882/re3-md5sum.html > Und auch wichtig: Die Prüfsumme extra und nicht inline bilden, also nicht mittels > tee vor dem Packen sondern anschliessend mit > > gzip -cd test.gz | md5sum > > Man will ja wissen ob die Daten korrekt gepackt wurden und nicht ob sie korrekt > dem Packer übergeben wurden. Wenn du eine Prüfsumme von den komprimierten Daten bildest (und prüfst) weißt du doch nicht ob der Komprimierer korrekt... http://www.pro-linux.de/artikel/2/1568/comm/512882/re3-md5sum.html Tue, 15 May 2012 17:51:35 +0200 Re: So läufts hier http://www.pro-linux.de/artikel/2/1568/comm/512881/re-so-laeufts-hier.html > Wenn es sich irgendwie vermeiden läßt umgehe ich Snapshots auf LVM-Ebene - das gibt "LVM-Fragmentierung" Wenn man nicht gerade während eines Backups ein "normales" LV anliegt, gibt es keine Fragmentierung. Außerdem kann man die SS-LVs auch auf ein extra PV legen. http://www.pro-linux.de/artikel/2/1568/comm/512881/re-so-laeufts-hier.html Tue, 15 May 2012 17:40:22 +0200 So läufts hier http://www.pro-linux.de/artikel/2/1568/comm/512840/so-laeufts-hier.html Ich arbeite ähnlich, aber die Unterschiede sind sicher interessant: Eine zu sichernde Partition(*1) fülle ich erstmal mit Nullen damit das Image wirklich klein wird, z.B. mount /dev/whatever /mnt && cat /dev/zero >/mnt/zero ; rm /mnt/zero && umount /mnt Images werden dadurch MASSIV kleiner. Selbst frisch installierte Partitionen werden bei gzip anschliessend 20-40% kleiner. Bei lange genutzten... http://www.pro-linux.de/artikel/2/1568/comm/512840/so-laeufts-hier.html Tue, 15 May 2012 06:26:43 +0200 Re[2]: nice http://www.pro-linux.de/artikel/2/1568/comm/512839/re2-nice.html Hätte man besser nicht zusammenfassen können. Ein Nachtrag: Wer auf einem Vielbenutzer-VM-System unnötig parallel arbeitet verschwendet nunmal Resourcen. Ob der lownice-Job nun mit einem Threat in vier Stunden fertig ist oder mit vier Threats in einer Stunde - das ist egal. Wichtiger ist daß der Viererthreat mehr RAM belegt, mehr Plattenzugriffe in kürzerer Zeit erzeugt usw. D.h. es bleiben... http://www.pro-linux.de/artikel/2/1568/comm/512839/re2-nice.html Tue, 15 May 2012 06:16:09 +0200 Re[2]: md5sum http://www.pro-linux.de/artikel/2/1568/comm/512838/re2-md5sum.html Sehr wichtiger Hinweis: IMMER nochmal mit md5sum eine Prüfsumme bilden!!! rzip und lzip haben z.B. in einigen Versionen/Compileroptionen Bitfehler produziert. Und defekte Hardware - ein überraschend häufiges Problem - macht das sowieso immer. Und auch wichtig: Die Prüfsumme extra und nicht inline bilden, also nicht mittels tee vor dem Packen sondern anschliessend mit gzip -cd test.gz | md5sum... http://www.pro-linux.de/artikel/2/1568/comm/512838/re2-md5sum.html Tue, 15 May 2012 06:12:07 +0200 Re: nice http://www.pro-linux.de/artikel/2/1568/comm/512829/re-nice.html für die .bash_aliases: alias lownice='ionice -c 3 nice -n 20' http://www.pro-linux.de/artikel/2/1568/comm/512829/re-nice.html Mon, 14 May 2012 20:30:04 +0200 Re: md5sum http://www.pro-linux.de/artikel/2/1568/comm/512821/re-md5sum.html Sollte natürlich heißen: md5sum > /backup/vmname.img .md5 http://www.pro-linux.de/artikel/2/1568/comm/512821/re-md5sum.html Mon, 14 May 2012 19:04:01 +0200 nice http://www.pro-linux.de/artikel/2/1568/comm/512816/nice.html > Haben Sie schon einmal versucht, 40 GByte mit gzip zu komprimieren? Das dauert > (fast) ewig, die CPU wird heiß und Ihr Server, wenn er nicht gerade im Leerlauf > läuft, reagiert plötzlich nur noch träge. träge? -> man nice http://www.pro-linux.de/artikel/2/1568/comm/512816/nice.html Mon, 14 May 2012 18:42:06 +0200 md5sum http://www.pro-linux.de/artikel/2/1568/comm/512815/md5sum.html Wer einem solch unbekannten Programm nicht ganz traut, hängt noch ein md5sum mit rein: dd if=/dev/vg0/vmname_snap bs=4M | tee >(md5sum > /backup/vmname.img) | lzop -c > /backup/vmname.img.lzo (die >(...)-Syntax ist allerdings bash-spezifisch!) http://www.pro-linux.de/artikel/2/1568/comm/512815/md5sum.html Mon, 14 May 2012 18:39:47 +0200 Re: LZOP - Lempel Ziv Oberhummer Packer http://www.pro-linux.de/artikel/2/1568/comm/512814/re-lzop-lempel-ziv-oberhummer-packer.html Siehe hier: http://www.oberhumer.com/opensource/ Jahrelange solide Systemarbeit. Bewundernswert. 8) http://www.pro-linux.de/artikel/2/1568/comm/512814/re-lzop-lempel-ziv-oberhummer-packer.html Mon, 14 May 2012 18:20:06 +0200 LZOP - Lempel Ziv Oberhummer Packer http://www.pro-linux.de/artikel/2/1568/comm/512813/lzop-lempel-ziv-oberhummer-packer.html Klingt irgendwie nach der Wildsau von Graz, der den UPX-Packer geschrieben hat. ;) http://www.pro-linux.de/artikel/2/1568/comm/512813/lzop-lempel-ziv-oberhummer-packer.html Mon, 14 May 2012 18:10:31 +0200 Re: Warum dd? http://www.pro-linux.de/artikel/2/1568/comm/512809/re-warum-dd.html Die Macht der Gewohnheit ... Ich habe es gerade schnell getestet, cat spart tatsächlich nochmals ein paar Sekunden. Danke für den Hinweis! http://www.pro-linux.de/artikel/2/1568/comm/512809/re-warum-dd.html Mon, 14 May 2012 17:40:32 +0200 Re: Es gibt noch mehr Alternativen http://www.pro-linux.de/artikel/2/1568/comm/512808/re-es-gibt-noch-mehr-alternativen.html LZ4 und Snappy sollten gleich schnell und gleich gut komprimieren, sind jedoch zusätzlich bei der Dekompression bis zu doppelt so schnell. (kleiner Benchmark des LZ4 machers: https://code.google.com/p/lz4/) Snappy ist von Google und für 64bit Betriebssysteme optimiert. Bei 32bit ist jedoch LZ4 bei weitem schneller. Leider keine Ahnung ob es dafür schon fertige Pakete gibt. http://www.pro-linux.de/artikel/2/1568/comm/512808/re-es-gibt-noch-mehr-alternativen.html Mon, 14 May 2012 17:39:59 +0200 Re: Warum dd? http://www.pro-linux.de/artikel/2/1568/comm/512806/re-warum-dd.html Habe auch nie verstanden, warum man bei Block-Devices immer 'dd' benutzt. Vielleicht sehe ich aber auch nur nicht den Unterschied zwischen dd und cat (abgesehen von Blockgrößen und ähnlichem Kram, von DD den ich aber eher hinderlich finde). Persönlich benutzte ich gerne 'pv' um Block-Devices auszulesen, da man da noch ne schicke Fortschrittsanzeige mitbekommt. http://www.pro-linux.de/artikel/2/1568/comm/512806/re-warum-dd.html Mon, 14 May 2012 17:20:34 +0200 Re: RAR? http://www.pro-linux.de/artikel/2/1568/comm/512805/re-rar.html Das macht sich rar. http://www.pro-linux.de/artikel/2/1568/comm/512805/re-rar.html Mon, 14 May 2012 16:46:33 +0200 Re: Es gibt noch mehr Alternativen http://www.pro-linux.de/artikel/2/1568/comm/512804/re-es-gibt-noch-mehr-alternativen.html 7z und peazip nicht zu vergessen. http://www.pro-linux.de/artikel/2/1568/comm/512804/re-es-gibt-noch-mehr-alternativen.html Mon, 14 May 2012 16:45:46 +0200 Warum dd? http://www.pro-linux.de/artikel/2/1568/comm/512800/warum-dd.html Warum dd? dd umgeht einige Optimierungen beim Zugriff indem es direkt RAW auf das Device-Zugreift, ein normales "< " oder ein cat sollte noch einmal schneller sein und man spart sich das herausfinden der "korrekten" Blockgröße. http://www.pro-linux.de/artikel/2/1568/comm/512800/warum-dd.html Mon, 14 May 2012 16:19:49 +0200 RAR? http://www.pro-linux.de/artikel/2/1568/comm/512799/rar.html Und wo ist rar? http://www.pro-linux.de/artikel/2/1568/comm/512799/rar.html Mon, 14 May 2012 16:19:45 +0200 Es gibt noch mehr Alternativen http://www.pro-linux.de/artikel/2/1568/comm/512795/es-gibt-noch-mehr-alternativen.html Neben gzip, bzip2 und lzop, sollte man auch unbedingt lzip und xz Utils ausprobieren. Insbesondere mit lzip haben wir sehr gute Erfahrungen gemacht, wenn es um Speed versus Compression geht. http://www.pro-linux.de/artikel/2/1568/comm/512795/es-gibt-noch-mehr-alternativen.html Mon, 14 May 2012 15:28:56 +0200 Re: Typo http://www.pro-linux.de/artikel/2/1568/comm/512792/re-typo.html Gängige Kompressionsalgorithmen sind generell besser als naives Run-Length-Encoding. Das versucht man zu minimieren, indem man die virtuelle Disk als Sparse File anlegt oder komplett mit Nullen initialisiert. Aber selbst wenn mal alles voll ist, ist lzop trotzdem noch viel schneller als die anderen :) http://www.pro-linux.de/artikel/2/1568/comm/512792/re-typo.html Mon, 14 May 2012 14:44:11 +0200 Re: Typo http://www.pro-linux.de/artikel/2/1568/comm/512789/re-typo.html Danke, wurde korrigiert. Cheers, demon http://www.pro-linux.de/artikel/2/1568/comm/512789/re-typo.html Mon, 14 May 2012 14:34:58 +0200 Re[2]: Typo http://www.pro-linux.de/artikel/2/1568/comm/512787/re2-typo.html Ja, der Sinn ist geradezu diametral entgegengesetzt... Schön, dass ich helfen konnte. http://www.pro-linux.de/artikel/2/1568/comm/512787/re2-typo.html Mon, 14 May 2012 14:25:19 +0200 Re: Typo http://www.pro-linux.de/artikel/2/1568/comm/512786/re-typo.html Puh danke, ich hätte den Satz sonst nämlich nicht verstanden mit dem Schreibfehler ... http://www.pro-linux.de/artikel/2/1568/comm/512786/re-typo.html Mon, 14 May 2012 14:21:59 +0200 Typo http://www.pro-linux.de/artikel/2/1568/comm/512783/typo.html Ein kleiner Fehler ist im Text versteckt: "Der KVM-Host reagiert auch dann noch zufriedenstellen d , wenn gerade ein Backup läuft, der Platzbedarf des Backups ist OK, der Zeitaufwand ebenso." Interessant wäre es auch gewesen, mal zu sehen wie sich ein per Hand implementiertes Run-Length-Encoding schlägt. Ich nehme an, dass bei Plattenimages viele Wiederholungen (beispielsweise Nullen)... http://www.pro-linux.de/artikel/2/1568/comm/512783/typo.html Mon, 14 May 2012 14:10:42 +0200