Page 1 of 1

Hardlinks aufspüren

Posted: 02. Dec 2007 10:03
by Linker
Hallo,

gibt es eine Möglichkeit, festzustellen, vieviele Hardlinks auf einer Partition bestehen?
Genauer, die Dateinamen aufzulisten, die auf die gleiche Datei verweisen (aber eben keine symbolischen Links)

hardlink

Posted: 02. Dec 2007 11:21
by sumsi
Moin,

Ein Hardlink ist ein neuer Verzeichniseintrag auf eine schon bestehende Inode dh.
es sich nur um Namenseinträge, die auf die selbe Inode zeigen.

Das geht (u.a.) mit dem ls-Befehl nach inodes:

Beispiel:

Code: Select all

[joern@erde ~]$ touch linktest.text
[joern@erde ~]$ ls -li linktest.text
203893957 -rw-r--r-- 1 joern joern 0 Dez  2 11:09 linktest.text

[joern@erde ~]$ ln linktest.text linktest2.text 

Code: Select all

[joern@erde ~]$ ls -ilR  | grep "^ *203893957"
203893957 -rw-r--r--  2 joern joern        0 Dez  2 11:09 linktest2.text
203893957 -rw-r--r--  2 joern joern        0 Dez  2 11:09 linktest.text
Gruß
sumsi

Posted: 03. Dec 2007 9:49
by Linker
Danke, aber das funktioniert bei Dir nur, weil Du den Namen und das Verzeichnis kennst. Ich dachte eher an etwas wie:

Finde alle hardlinks unterhalb von /usr. Also alle Namen, die auf die auf die jeweils gleiche Datei (Inode) verweisen. Anders ausgedrück: Finde alle Doppel (oder mehrfach)einträge

Quasi ein "find /usr -type l", nur halt nicht für symbolische Links.

link

Posted: 03. Dec 2007 10:41
by sumsi
Moin,

da fällt mir jetzt keine fertige Lösung ein.

Mit

Code: Select all

 ls -ilR 

bekommt amn alles der Reihenfolge gelistet, es fällt da schon auf, wenn 2 Inode-Bezeichner gleich sind.

Mit

Code: Select all

 find -links N 
, für N eine Zahl, kann man nach voerhandenen mehrfachgelinkten Dateine suchen, man muss aber die Linkanzahl angeben.

Es bleibt dann also, um das zu automatisieren wahrscheinlich nur übrig, ein Script zu basteln.
Entweder ein Script, wo die Linkanzahl durchprobiert wird, oder
eines wo man sich eine Inode-Nr. nimmt und dann vergleicht, ob diese ein zweites Mal existiert und dann die nächste Nummer ...

Grüße
sumsi

Nachtrag

Posted: 03. Dec 2007 10:51
by sumsi
Nachtrag

Beim find-Befehl fehlt natürlich noch dei Ursprungspunkt ;-)

Hinterher kann man immer sagen: Man solllte den Istzustand des Rechners
(Dateien-anzahl, Anzahl S.-Bits, Rechte, usw..) mit Bordmitteln oder mit div. Tools Inventurisieren um im Schadensfall schnell eine Übersicht zu bekommen.

Wenn ich Hardlinks im Unix-Source-Verzeichnis feststellen würde, ich glaube dann die Kiste würde ich neu aufsetzen. Ohne Püfsummenvergleich ist man nich 100% sicher, ob noch irgenwo ein rootkit oder andere Hintertür drinn' steckt ....

sumsi

Posted: 03. Dec 2007 14:41
by jochen
Die man-Page zu find ist nicht allumfassend, die info-Page aber genauer:

Code: Select all

find . -links +1 ! -type d -print
liefert alle Dateien beliebigen Typs außer Verzeichnissen, die mehr als einen Hardlink haben. Ein Hardlink selbst ist ja die Mindestanzahl und entspricht den zuerst vergebenen Dateinamen.

Verzeichnisse werden ausgeklammert, da man sowieso auf Directories keine Hardlinks setzen darf. Der Linkcounter steht dort auch immer auf mind. 2 (Verweis aus dem übergeordneten Verzeichnis plus "." im Verzeichnis selbst) plus Anzahl enthaltener Subdirectories (Verweis ".." pro Subdirectory). Da kann man - denke ich - nix Verwertbares draus machen.

Wenn man jetzt wissen möchte, welche von diesen Dateien zueinander gehören, müsste man das find-Kommando ein wenig aufbohren:

Code: Select all

find . -links +1 ! -type d -print0 | xargs -0 ls -i | sort -n
Zum Mitschreiben: find funktioniert wie vorher, trennt aber die Dateinamen in der Ausgabe mittels '\0' - Nullbyte bzw. ASCII-NUL. Das erwartet xargs auch wg Option -0 und bastelt daraufhin ein ls-Kommando für alle gefundenen Dateien zusammen. (-print0/-0 verhindert, das Leerzeichen im Dateinamen zum Problem werden.) Wegen Option -i packt ls vor die Dateinamen die Inodenummer, anhand derer sort zum Schluss nummerisch sortiert.

Ich hoffe, das hilft weiter.

Jochen

Posted: 03. Dec 2007 14:48
by jochen
@sumsi:

Code: Select all

$ find /usr/bin ! -type d -links +1 -print | wc -l
42
$
Und nein, ich werde die Maschine nicht neu aufsetzen :). Eine Datei unter mehreren unterschiedlichen Namen verfügbar zu machen und die Namen als eine Art implizite Aufrufoption zu verwenden ist althergebrachte UNIX-Technik. Beispielsweise sind "compress" und "uncompress" ein und dasselbe Binary, aber rufe ich es unter dem zweiten Namen auf, wirkt es, als hätte ich "compress -d" gestartet.

Jochen

Posted: 03. Dec 2007 15:05
by Janka
42! Wie war nochmal die Frage?

Janka

Posted: 22. Oct 2008 5:35
by WerllWork
Hey!
Ich kann das Programm Clone Remover vorsagen Finde doppelte Bilder!
Ich empfehle, es auszunutzen! :wink: