Login
Login-Name Passwort


 
Newsletter
Werbung

Mo, 19. Juli 1999, 00:00

Perl/CGI-Workshop, Teil 10

Metazeichen (2)

Die Metazeichen, die wir bisher kennengelernt haben, waren dazu geeignet, dem Perl-Interpreter mitzuteilen, was er matchen soll. Dann gibt es da noch die sog. Quantoren, die dazu verwendet werden, bestimmte Muster eine bestimmte Anzahl mal zu matchen.

So ein Quantor wird dabei hinter einen Ausdruck geschrieben. Da gibt es z.B. das "+", welches für ein oder mehrere Vorkommen des voranstehenden Ausdrucks steht. Wenn dieser Ausdruck nicht nur das unmittelbar davorstehende sein soll, können Sie natürlich auch Klammern verwenden:

<em>#!/usr/bin/perl</em>
<em># plus.pl -- by W. Jährling</em>
$path = "/opt/gnome/bin";
if ($path =~ /^\/.+\/bin$/) {
 <em># Der Pfad ist ein absoluter (beginnt mit "/")</em>
 <em># und endet mit "/bin" (ist aber nicht "/bin").</em>
}
<em># Durch die entwerteten Schrägstriche (\/) wird</em>
<em># der reguläre Ausdruck sehr unübersichtlich,</em>
<em># weshalb man hier wohl die Option "m" verwenden würde,</em>
<em># die es erlaubt, statt dem / die den Regexp begrenzen ein</em>
<em># beliebiges anderes Zeichen zu verwenden:</em>
if ($path =~ m#^/.+/bin$#) {
 <em># Der Pfad ist ein absoluter (beginnt mit "/")</em>
 <em># und endet mit "/bin" (ist aber nicht "/bin").</em>
}

Neben dem "+" gibt es noch einige andere Quantoren. Etwa den Stern, der für eine beliebige Anzahl des davorstehenden Ausdrucks steht, also auch gar kein Vorkommen:

<em>#!/usr/bin/perl</em>
<em># stern.pl -- by W. Jährling</em>
$zeux = "a" x 5; <em># ergibt "aaaaa"</em>
$zeux = "gg$zeux"; <em># ergibt "ggaaaaa"</em>
if ($zeux =~ /g&#91;aeiou&#93;*$/) {
 <em># der String muss ein "g" enthalten,</em>
 <em># das entweder am Ende des Strings steht</em>
 <em># oder dem bis zum Ende des Strings ($) nur</em>
 <em># noch Vokale folgen.</em>
}
$zeux = "abacafax";
$zeux .= "XYZql"; <em># Hängt "XYZql" an $zeux an.</em>
if ($zeux =~ /^(a&#91;a-z&#93;)*&#91;A-Z&#93;/) {
 <em># Die Zeichenkette beginnt mit einem</em>
 <em># Großbuchstaben, vor dem evtl. noch</em>
 <em># abwechselnd "a"s und ein Kleinbuchstaben</em>
 <em># stehen dürfen.</em>
}

Desweiteren möchte ich Sie noch mit dem "?" bekanntmachen, welches in Regexps für ein oder null Vorkommen des davorstehenden Ausdrucks steht. Ich bin jetzt aber viel zu faul, dafür jetzt ein Beispiel zu schreiben.

Stattdessen möchte ich Ihnen jetzt einen Quantor vorstellen, der viel mehr kann als alle anderen zusammen:

<em>#!/usr/bin/perl</em>
<em># superman.pl -- by W. Jährling</em>
$buchstabensuppe = "zdMUaFeztNpUnzAJTut";
if ($buchstabensuppe =~ /&#91;a-z&#93;&#91;A-Z&#93;{2,4}&#91;a-z&#93;/) {
 <em># Enthält irgendwo 2 bis 4 Großbuchstaben,</em>
 <em># die zwischen Kleinbuchstaben stehen.</em>
}

{x,y} bedeutet also: Mindestens x mal, höchstens y mal. Dabei kann entweder x oder y weggelassen werden: {x,} bedeutet "x bis unendlich mal" und {,y} steht für höchstens y mal.

Vorerst wollen wir uns mal mit diesem Wissen über Regexps begnügen, wobei wir deren Potential nun noch nicht vollständig ausgeschöpft haben (wir werden nochmal darauf zurückkommen. Sie wissen jetzt aber, was Regexps sind und das sie ein extrem mächtiges Werkzeug sind (das aber leider recht fehleranfällig ist).


[<< Zurück] [Weiter >>]
Kommentare (Insgesamt: 0 || Kommentieren )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung