bash: Zufällige Elemente aus einer Liste

Post Reply
Message
Author
Rudni

bash: Zufällige Elemente aus einer Liste

#1 Post by Rudni »

Hallo,

Aus einer rein aus Zahlen bestehenden Liste (sagen wir durchnummeriert von 0001 - 1000) würde ich gerne 10% der Elemente zufällig auswählen, also in diesem Beispiel 100 eindeutige Namen, die in diesem Bereich liegen.

Geht das?

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#2 Post by Janka »

Klar geht das. Nur ist es nicht besonders simpel, gerade in bash. Gibt es einen Grund, sowas ausgerechnet in bash machen zu wollen?

Grundsätzliches vorgehen: Zwei Listen, Quellliste, am Anfang voll, Zielliste, am Anfang leer. Ein zufälliges Element aus der Quellliste rauspicken, dort entfernen, in die Zielliste eintragen.
100 mal wiederholen.

In Tcl wär das z.B. wie folgt zu machen:

Code: Select all

#!/usr/bin/tclsh

set q {1 2 3 4 5 6 7 8 9 10 11 12 13}
set z {}

for &#123;set c 0&#125; &#123;$c<5&#125; &#123;incr c&#125; &#123;
  set i &#91;expr int&#40;rand&#40;&#41;*&#91;llength $q&#93;&#41;&#93;
  lappend z &#91;lindex $q $i&#93;
  set q &#91;lreplace $q $i $i&#93;
&#125;

puts $z
Mit bash musst du die notwendigen Stringoperationen llength, lindex und lreplace selbst schreiben.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

Rudni

#3 Post by Rudni »

Ja, es gibt einen Grund. Das gesamte Skript ist alles bash, denn das ist das Einzige, was ich zumindest minimal kann, dies ist nur ein Auszug. Ich wüßte auch nicht, wie ich tcl in bash einbinden kann.

Bei der bash scheitere ich an den Schleifen, um auf Duplikate zu überprüfen. Ach, wie wünschte ich mir gerade goto & Zeilennummern zurück...


Trotzdem vielen Dank für Deine Mühe

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#4 Post by Janka »

Dann nimm doch einfach das Skript oben. Die Syntax der tclsh ist so schwierig nicht. Wenn du mir genau sagst was du haben willst, puste ich dir das Skript auch gerne noch ein wenig auf.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

Rudni

#5 Post by Rudni »

Vielen Dank erstmal,

vielleicht komme ich darauf sogar zurück. Aber mit Chance habe ich auch eine bash Lösung gefunden, kann ich aber erst morgen testen:

Code: Select all

FILES=10000000
LANGE=`echo $&#123;#FILES&#125;`
FAKTOR=2000000
NOADD=0
WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
DELETE=`echo $&#123;WERT&#125;`
ZAEHLER=1

while &#91; $&#123;ZAEHLER&#125; -le $&#123;FAKTOR&#125; &#93;; do
   WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
   for Y in $&#123;DELETE&#125;; do
      if &#91; "$&#123;Y&#125;" == "$&#123;WERT&#125;" &#93;; then      
         NOADD=1
         break
      fi
   done
   if &#91; ! "$&#123;NOADD&#125;" == "1" &#93;; then 
      WERT=`printf "%0$&#123;LANGE&#125;d\n" $&#123;WERT&#125;`
      DELETE=`echo -n $&#123;DELETE&#125; echo -n $&#123;WERT&#125;`
      let ZAEHLER+=1
   fi
   NOADD=0
done
Gut, etwas umständlich und rechenaufwendig bei geschätzen 10 000 000 Dateien, aber wofür haben wir GHz Prozessoren?

Rudni

ONL73O

#6 Post by Rudni »

Viel Einfacher:

Code: Select all

ls | sort --random-sort | head -n 2000

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#7 Post by Janka »

Und schnell, wie praktisch! Danke fürs Posten dieser Lösung.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

komsomolze
Posts: 430
Joined: 03. Mar 2006 23:16

#8 Post by komsomolze »

Rudnis Lösung ist ja klasse.



Hier noch ein bischen bash-random.
In /etc/cron.daily/apt :

Code: Select all

random_sleep&#40;&#41;
&#123;
    RandomSleep=1800
    eval $&#40;apt-config shell RandomSleep APT&#58;&#58;Periodic&#58;&#58;RandomSleep&#41;
    if &#91; $RandomSleep -eq 0 &#93;; then
        return
    fi
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
    debug_echo "sleeping for $TIME seconds"
    sleep $TIME
&#125;
darin der operative Teil:

Code: Select all

    RandomSleep=1800
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
Und die Anmerkung darin führt zu:

Code: Select all

$ echo $RANDOM
29640
$ echo $RANDOM
1890
$ echo $RANDOM
13575
mfg komsomolze

Post Reply