Hardlinks aufspüren

Antworten
Nachricht
Autor
Linker

Hardlinks aufspüren

#1 Beitrag von Linker » 02. Dez 2007 10:03

Hallo,

gibt es eine Möglichkeit, festzustellen, vieviele Hardlinks auf einer Partition bestehen?
Genauer, die Dateinamen aufzulisten, die auf die gleiche Datei verweisen (aber eben keine symbolischen Links)

sumsi

hardlink

#2 Beitrag von sumsi » 02. Dez 2007 11:21

Moin,

Ein Hardlink ist ein neuer Verzeichniseintrag auf eine schon bestehende Inode dh.
es sich nur um Namenseinträge, die auf die selbe Inode zeigen.

Das geht (u.a.) mit dem ls-Befehl nach inodes:

Beispiel:

Code: Alles auswählen

[joern@erde ~]$ touch linktest.text
[joern@erde ~]$ ls -li linktest.text
203893957 -rw-r--r-- 1 joern joern 0 Dez  2 11:09 linktest.text

[joern@erde ~]$ ln linktest.text linktest2.text 

Code: Alles auswählen

[joern@erde ~]$ ls -ilR  | grep "^ *203893957"
203893957 -rw-r--r--  2 joern joern        0 Dez  2 11:09 linktest2.text
203893957 -rw-r--r--  2 joern joern        0 Dez  2 11:09 linktest.text
Gruß
sumsi

Linker

#3 Beitrag von Linker » 03. Dez 2007 9:49

Danke, aber das funktioniert bei Dir nur, weil Du den Namen und das Verzeichnis kennst. Ich dachte eher an etwas wie:

Finde alle hardlinks unterhalb von /usr. Also alle Namen, die auf die auf die jeweils gleiche Datei (Inode) verweisen. Anders ausgedrück: Finde alle Doppel (oder mehrfach)einträge

Quasi ein "find /usr -type l", nur halt nicht für symbolische Links.

sumsi

link

#4 Beitrag von sumsi » 03. Dez 2007 10:41

Moin,

da fällt mir jetzt keine fertige Lösung ein.

Mit

Code: Alles auswählen

 ls -ilR 

bekommt amn alles der Reihenfolge gelistet, es fällt da schon auf, wenn 2 Inode-Bezeichner gleich sind.

Mit

Code: Alles auswählen

 find -links N 
, für N eine Zahl, kann man nach voerhandenen mehrfachgelinkten Dateine suchen, man muss aber die Linkanzahl angeben.

Es bleibt dann also, um das zu automatisieren wahrscheinlich nur übrig, ein Script zu basteln.
Entweder ein Script, wo die Linkanzahl durchprobiert wird, oder
eines wo man sich eine Inode-Nr. nimmt und dann vergleicht, ob diese ein zweites Mal existiert und dann die nächste Nummer ...

Grüße
sumsi

sumsi

Nachtrag

#5 Beitrag von sumsi » 03. Dez 2007 10:51

Nachtrag

Beim find-Befehl fehlt natürlich noch dei Ursprungspunkt ;-)

Hinterher kann man immer sagen: Man solllte den Istzustand des Rechners
(Dateien-anzahl, Anzahl S.-Bits, Rechte, usw..) mit Bordmitteln oder mit div. Tools Inventurisieren um im Schadensfall schnell eine Übersicht zu bekommen.

Wenn ich Hardlinks im Unix-Source-Verzeichnis feststellen würde, ich glaube dann die Kiste würde ich neu aufsetzen. Ohne Püfsummenvergleich ist man nich 100% sicher, ob noch irgenwo ein rootkit oder andere Hintertür drinn' steckt ....

sumsi

Benutzeravatar
jochen
prolinux-forum-admin
Beiträge: 699
Registriert: 14. Jan 2000 15:37
Wohnort: Jülich
Kontaktdaten:

#6 Beitrag von jochen » 03. Dez 2007 14:41

Die man-Page zu find ist nicht allumfassend, die info-Page aber genauer:

Code: Alles auswählen

find . -links +1 ! -type d -print
liefert alle Dateien beliebigen Typs außer Verzeichnissen, die mehr als einen Hardlink haben. Ein Hardlink selbst ist ja die Mindestanzahl und entspricht den zuerst vergebenen Dateinamen.

Verzeichnisse werden ausgeklammert, da man sowieso auf Directories keine Hardlinks setzen darf. Der Linkcounter steht dort auch immer auf mind. 2 (Verweis aus dem übergeordneten Verzeichnis plus "." im Verzeichnis selbst) plus Anzahl enthaltener Subdirectories (Verweis ".." pro Subdirectory). Da kann man - denke ich - nix Verwertbares draus machen.

Wenn man jetzt wissen möchte, welche von diesen Dateien zueinander gehören, müsste man das find-Kommando ein wenig aufbohren:

Code: Alles auswählen

find . -links +1 ! -type d -print0 | xargs -0 ls -i | sort -n
Zum Mitschreiben: find funktioniert wie vorher, trennt aber die Dateinamen in der Ausgabe mittels '\0' - Nullbyte bzw. ASCII-NUL. Das erwartet xargs auch wg Option -0 und bastelt daraufhin ein ls-Kommando für alle gefundenen Dateien zusammen. (-print0/-0 verhindert, das Leerzeichen im Dateinamen zum Problem werden.) Wegen Option -i packt ls vor die Dateinamen die Inodenummer, anhand derer sort zum Schluss nummerisch sortiert.

Ich hoffe, das hilft weiter.

Jochen
Die grösste Lüge der EDV? "Mal eben..."

Benutzeravatar
jochen
prolinux-forum-admin
Beiträge: 699
Registriert: 14. Jan 2000 15:37
Wohnort: Jülich
Kontaktdaten:

#7 Beitrag von jochen » 03. Dez 2007 14:48

@sumsi:

Code: Alles auswählen

$ find /usr/bin ! -type d -links +1 -print | wc -l
42
$
Und nein, ich werde die Maschine nicht neu aufsetzen :). Eine Datei unter mehreren unterschiedlichen Namen verfügbar zu machen und die Namen als eine Art implizite Aufrufoption zu verwenden ist althergebrachte UNIX-Technik. Beispielsweise sind "compress" und "uncompress" ein und dasselbe Binary, aber rufe ich es unter dem zweiten Namen auf, wirkt es, als hätte ich "compress -d" gestartet.

Jochen
Die grösste Lüge der EDV? "Mal eben..."

Benutzeravatar
Janka
Beiträge: 3585
Registriert: 11. Feb 2006 19:10

#8 Beitrag von Janka » 03. Dez 2007 15:05

42! Wie war nochmal die Frage?

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

WerllWork

#9 Beitrag von WerllWork » 22. Okt 2008 5:35

Hey!
Ich kann das Programm Clone Remover vorsagen Finde doppelte Bilder!
Ich empfehle, es auszunutzen! :wink:

Antworten