bash: Zufällige Elemente aus einer Liste

Antworten
Nachricht
Autor
Rudni

bash: Zufällige Elemente aus einer Liste

#1 Beitrag von Rudni » 04. Feb 2010 18:02

Hallo,

Aus einer rein aus Zahlen bestehenden Liste (sagen wir durchnummeriert von 0001 - 1000) würde ich gerne 10% der Elemente zufällig auswählen, also in diesem Beispiel 100 eindeutige Namen, die in diesem Bereich liegen.

Geht das?

Benutzeravatar
Janka
Beiträge: 3580
Registriert: 11. Feb 2006 19:10

#2 Beitrag von Janka » 04. Feb 2010 18:50

Klar geht das. Nur ist es nicht besonders simpel, gerade in bash. Gibt es einen Grund, sowas ausgerechnet in bash machen zu wollen?

Grundsätzliches vorgehen: Zwei Listen, Quellliste, am Anfang voll, Zielliste, am Anfang leer. Ein zufälliges Element aus der Quellliste rauspicken, dort entfernen, in die Zielliste eintragen.
100 mal wiederholen.

In Tcl wär das z.B. wie folgt zu machen:

Code: Alles auswählen

#!/usr/bin/tclsh

set q {1 2 3 4 5 6 7 8 9 10 11 12 13}
set z {}

for &#123;set c 0&#125; &#123;$c<5&#125; &#123;incr c&#125; &#123;
  set i &#91;expr int&#40;rand&#40;&#41;*&#91;llength $q&#93;&#41;&#93;
  lappend z &#91;lindex $q $i&#93;
  set q &#91;lreplace $q $i $i&#93;
&#125;

puts $z
Mit bash musst du die notwendigen Stringoperationen llength, lindex und lreplace selbst schreiben.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

Rudni

#3 Beitrag von Rudni » 04. Feb 2010 20:03

Ja, es gibt einen Grund. Das gesamte Skript ist alles bash, denn das ist das Einzige, was ich zumindest minimal kann, dies ist nur ein Auszug. Ich wüßte auch nicht, wie ich tcl in bash einbinden kann.

Bei der bash scheitere ich an den Schleifen, um auf Duplikate zu überprüfen. Ach, wie wünschte ich mir gerade goto & Zeilennummern zurück...


Trotzdem vielen Dank für Deine Mühe

Benutzeravatar
Janka
Beiträge: 3580
Registriert: 11. Feb 2006 19:10

#4 Beitrag von Janka » 04. Feb 2010 20:51

Dann nimm doch einfach das Skript oben. Die Syntax der tclsh ist so schwierig nicht. Wenn du mir genau sagst was du haben willst, puste ich dir das Skript auch gerne noch ein wenig auf.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

Rudni

#5 Beitrag von Rudni » 04. Feb 2010 21:18

Vielen Dank erstmal,

vielleicht komme ich darauf sogar zurück. Aber mit Chance habe ich auch eine bash Lösung gefunden, kann ich aber erst morgen testen:

Code: Alles auswählen

FILES=10000000
LANGE=`echo $&#123;#FILES&#125;`
FAKTOR=2000000
NOADD=0
WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
DELETE=`echo $&#123;WERT&#125;`
ZAEHLER=1

while &#91; $&#123;ZAEHLER&#125; -le $&#123;FAKTOR&#125; &#93;; do
   WERT=`echo $&#40;&#40;$&#123;RANDOM&#125;%$&#123;FILES&#125;&#41;&#41;`
   for Y in $&#123;DELETE&#125;; do
      if &#91; "$&#123;Y&#125;" == "$&#123;WERT&#125;" &#93;; then      
         NOADD=1
         break
      fi
   done
   if &#91; ! "$&#123;NOADD&#125;" == "1" &#93;; then 
      WERT=`printf "%0$&#123;LANGE&#125;d\n" $&#123;WERT&#125;`
      DELETE=`echo -n $&#123;DELETE&#125; echo -n $&#123;WERT&#125;`
      let ZAEHLER+=1
   fi
   NOADD=0
done
Gut, etwas umständlich und rechenaufwendig bei geschätzen 10 000 000 Dateien, aber wofür haben wir GHz Prozessoren?

Rudni

ONL73O

#6 Beitrag von Rudni » 05. Feb 2010 16:49

Viel Einfacher:

Code: Alles auswählen

ls | sort --random-sort | head -n 2000

Benutzeravatar
Janka
Beiträge: 3580
Registriert: 11. Feb 2006 19:10

#7 Beitrag von Janka » 05. Feb 2010 20:19

Und schnell, wie praktisch! Danke fürs Posten dieser Lösung.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

komsomolze
Beiträge: 430
Registriert: 03. Mär 2006 23:16

#8 Beitrag von komsomolze » 13. Feb 2010 23:43

Rudnis Lösung ist ja klasse.



Hier noch ein bischen bash-random.
In /etc/cron.daily/apt :

Code: Alles auswählen

random_sleep&#40;&#41;
&#123;
    RandomSleep=1800
    eval $&#40;apt-config shell RandomSleep APT&#58;&#58;Periodic&#58;&#58;RandomSleep&#41;
    if &#91; $RandomSleep -eq 0 &#93;; then
        return
    fi
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
    debug_echo "sleeping for $TIME seconds"
    sleep $TIME
&#125;
darin der operative Teil:

Code: Alles auswählen

    RandomSleep=1800
    if &#91; -z "$RANDOM" &#93; ; then
        # A fix for shells that do not have this bash feature.
        RANDOM=$&#40;dd if=/dev/urandom count=1 2> /dev/null | cksum | cut -c"1-5"&#41;
    fi
    TIME=$&#40;&#40;$RANDOM % $RandomSleep&#41;&#41;
Und die Anmerkung darin führt zu:

Code: Alles auswählen

$ echo $RANDOM
29640
$ echo $RANDOM
1890
$ echo $RANDOM
13575
mfg komsomolze

Antworten