Seite 1 von 1

bash: Zufällige Elemente aus einer Liste

Verfasst: 04. Feb 2010 18:02
von Rudni
Hallo,

Aus einer rein aus Zahlen bestehenden Liste (sagen wir durchnummeriert von 0001 - 1000) würde ich gerne 10% der Elemente zufällig auswählen, also in diesem Beispiel 100 eindeutige Namen, die in diesem Bereich liegen.

Geht das?

Verfasst: 04. Feb 2010 18:50
von Janka
Klar geht das. Nur ist es nicht besonders simpel, gerade in bash. Gibt es einen Grund, sowas ausgerechnet in bash machen zu wollen?

Grundsätzliches vorgehen: Zwei Listen, Quellliste, am Anfang voll, Zielliste, am Anfang leer. Ein zufälliges Element aus der Quellliste rauspicken, dort entfernen, in die Zielliste eintragen.
100 mal wiederholen.

In Tcl wär das z.B. wie folgt zu machen:

Code: Alles auswählen

#!/usr/bin/tclsh

set q {1 2 3 4 5 6 7 8 9 10 11 12 13}
set z {}

for &#123;set c 0&#125; &#123;$c<5&#125; &#123;incr c&#125; &#123;
  set i &#91;expr int&#40;rand&#40;&#41;*&#91;llength $q&#93;&#41;&#93;
  lappend z &#91;lindex $q $i&#93;
  set q &#91;lreplace $q $i $i&#93;
&#125;

puts $z
Mit bash musst du die notwendigen Stringoperationen llength, lindex und lreplace selbst schreiben.

Janka

Verfasst: 04. Feb 2010 20:03
von Rudni
Ja, es gibt einen Grund. Das gesamte Skript ist alles bash, denn das ist das Einzige, was ich zumindest minimal kann, dies ist nur ein Auszug. Ich wüßte auch nicht, wie ich tcl in bash einbinden kann.

Bei der bash scheitere ich an den Schleifen, um auf Duplikate zu überprüfen. Ach, wie wünschte ich mir gerade goto & Zeilennummern zurück...


Trotzdem vielen Dank für Deine Mühe

Verfasst: 04. Feb 2010 20:51
von Janka
Dann nimm doch einfach das Skript oben. Die Syntax der tclsh ist so schwierig nicht. Wenn du mir genau sagst was du haben willst, puste ich dir das Skript auch gerne noch ein wenig auf.

Janka

Verfasst: 04. Feb 2010 21:18
von Rudni
Vielen Dank erstmal,

vielleicht komme ich darauf sogar zurück. Aber mit Chance habe ich auch eine bash Lösung gefunden, kann ich aber erst morgen testen:

Code: Alles auswählen

FILES=10000000
LANGE=`echo $&#123;#FILES&#125;`
FAKTOR=2000000
NOADD=0
WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
DELETE=`echo $&#123;WERT&#125;`
ZAEHLER=1

while &#91; $&#123;ZAEHLER&#125; -le $&#123;FAKTOR&#125; &#93;; do
   WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
   for Y in $&#123;DELETE&#125;; do
      if &#91; "$&#123;Y&#125;" == "$&#123;WERT&#125;" &#93;; then      
         NOADD=1
         break
      fi
   done
   if &#91; ! "$&#123;NOADD&#125;" == "1" &#93;; then 
      WERT=`printf "%0$&#123;LANGE&#125;d\n" $&#123;WERT&#125;`
      DELETE=`echo -n $&#123;DELETE&#125; echo -n $&#123;WERT&#125;`
      let ZAEHLER+=1
   fi
   NOADD=0
done
Gut, etwas umständlich und rechenaufwendig bei geschätzen 10 000 000 Dateien, aber wofür haben wir GHz Prozessoren?

ONL73O

Verfasst: 05. Feb 2010 16:49
von Rudni
Viel Einfacher:

Code: Alles auswählen

ls | sort --random-sort | head -n 2000

Verfasst: 05. Feb 2010 20:19
von Janka
Und schnell, wie praktisch! Danke fürs Posten dieser Lösung.

Janka

Verfasst: 13. Feb 2010 23:43
von komsomolze
Rudnis Lösung ist ja klasse.



Hier noch ein bischen bash-random.
In /etc/cron.daily/apt :

Code: Alles auswählen

random_sleep&#40;&#41;
&#123;
    RandomSleep=1800
    eval $&#40;apt-config shell RandomSleep APT&#58;&#58;Periodic&#58;&#58;RandomSleep&#41;
    if &#91; $RandomSleep -eq 0 &#93;; then
        return
    fi
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
    debug_echo "sleeping for $TIME seconds"
    sleep $TIME
&#125;
darin der operative Teil:

Code: Alles auswählen

    RandomSleep=1800
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
Und die Anmerkung darin führt zu:

Code: Alles auswählen

$ echo $RANDOM
29640
$ echo $RANDOM
1890
$ echo $RANDOM
13575