Пърл (език за програмиране)

от Уикипедия, свободната енциклопедия
Направо към: навигация, търсене
Perl
Парадигма функционален, обектно-ориентиран, процедурен
Реализиране през 1987
Автор Лари Уол
Типизация на данните динамична
Повлиян от AWK, C, C++, Lisp, Pascal, Sed, Smalltalk 80, Unix shell
Повлиява Python, PHP, Ruby, ECMAScript, LPC, Windows PowerShell, JavaScript, Falcon, Perl 6, Qore
Платформа Cross-platform
Софтуерен лиценз GPL or Artistic License
Уебсайт www.perl.org

Perl (произнася се „пърл“) е универсален, интерпретативен език за програмиране, създаден от Лари Уол през 1987 г. Лари е трябвало да създава отчети за системата, която е поддържал тогава, но не е съществувал подходящ инструмент за целта (програмата awk не е можела да отваря и затваря файлове въз основа на информацията в тях), което го подтиква да създаде свой специализиран инструмент, който по късно разпространява безплатно.


Име[редактиране | edit source]

Първоначално името на езика е било Pearl (произнася се по същия начин — „пърл“). Още преди да излезе първата версия на езика, Лари установява, че съществува език за програмиране на име PEARL. С цел да се избегнат конфликти, а и повлиян от характерната за философията на Unix тенденция към кратки имена, Лари променя името на езика на Perl, без да променя произношението му.

Впоследствие се появяват интерпретации на името като съкращение, най-популярната от които е Practical Extraction and Report Language (в превод: практичен език за извличане и отчети). Съществуват и много други интерпретации, включително и такива от самия Лари Уол, като например шеговитото Pathologically Eclectic Rubbish Lister (в превод: патологично многостранен изброител на глупости). Всички те обаче са бекроними. Името на езика не е съкращение от нищо, поради което се пише само с една главна буква — Perl, а не PERL (за разлика от споменатия език PEARL, чието име наистина е съкращение).

Съществува също така тънка разлика в значението в зависимост от това дали името е изписано с главна буква в началото или изцяло с малки букви. Perl е името на езика за програмиране, което, както (почти) всяко друго име, се пише с главна буква. Под perl се има предвид интерпретатора на езика Perl, т.е. програмата, която се стартира, за да се изпълни даден код на Perl. Името на интерпретатора спазва неписаното правило имената на команди под Юникс да са изцяло с малки букви.


Основни характеристики на Perl[редактиране | edit source]

В Perl са заимствани концепции от доста езици — C, awk, sed, Lisp и др. Най-силните му черти са регулярните изрази (англ. regular expression, често съкращавано на regex), вградените сложни структури от данни (обикновени и асоциативни масиви) и един от най-големите в света набори от свободно достъпни модули CPAN. На Perl може да се пише процедурно, обектно-ориентирано и функционално (поддържа затваряния, познати още като обвивки, една от най-мощните абстракции в компютърната наука). Perl е слабо типизиран език. Той е интерпретиран, като програмата първо се компилира до машиннонезависими инструкции (байткод), които се изпълняват от интерпретатора. За разлика от Java обаче, байткодът не е лесно достъпен, благодарение на което са избегнати редица проблеми с обратната съвместимост. Интерпретаторът на Perl e написан на C и е преносим на огромен брой платформи и операционни системи. Програмата perl2exe и модулът pp могат да бъдат използвани за произвеждане (генериране) на изпълними програми от скриптове на Perl.


Предимства на езика[редактиране | edit source]

Общността CPAN[редактиране | edit source]

CPAN (англ. Comprehensive Perl Archive Network, в превод Изчерпателна мрежа от архиви на Perl) представлява огромна колекция от софтуер написан изцяло или отчасти на Perl. Основната градивна единица на този софтуер е модулът. Съществуват незадалжителни, но препоръчителни (и често спазвани на практика) указания за писането на модули за Perl, с необходимата им документация, която често с простотата и стандартността си превъзхожда документацията на много комерсиални продукти. Разработчиците на Perl създават програмни модули, разрешаващи разнообразни проблеми за почти всички операционни системи и дори програмни езици. Тези модули обикновено са достъпни за използване под същия лиценз, както и самия Perl (т. нар. Artistic License), което допринася за по-нататъшното разрастване на общността. Всички тези модули могат да бъдат разгледани и свалени от metacpan.org.

Обработка на текст[редактиране | edit source]

Най-силната страна на Perl е обработката на текст. Това го прави изключително популярен сред системните администратори. Операции като отваряне, четене, синтактичен разбор (известен още като „парсване“), търсене, заместване на текстови файлове са кратки и лесни за програмиране, имплементирани са много ефективно и се изпълняват по-бързо отколкото в повечето други езици.

Динамични уеб страници[редактиране | edit source]

Разработчиците на динамични уеб страници (страниците, чиито съдържание се произвежда на момента на тяхното извикване — т. е. динамично) често използват Perl поради големия брой безплатни скриптове, както и общността на разработчици предлагащи помощ на своите колеги. Богатата библиотека с модули, споменатата мощна текстообработка, която често се налага при генерирането на HTML страници, както и фактът, че е слабо типизиран и интерпретиран език, правят възможна бързата разработка на приложения в много области, включително и настолни графични приложения.

Фактът, че Perl се интерпретира в момента на изпълнение, налага уеб сървърът да стартира на интерпретатора perl за всяка уеб страница, която трябва да се генерира. При по-натоварени сайтове това може да доведе до значително натоварване на системата, както откъм памет, така и откъм процесорно време. За да се избегне това, специално за Perl е създаден модула mod_perl за сървъра Apache, който на практика представлява интерпретатор за Perl, вграден в кода на Apache. Това позволява на уеб сървъра да изпълнява код на Perl, без да се налага да стартира нов процес за всяка заявена уеб страница. Това води до значително увеличение на производителността при намалени ресурси. Mod_perl отива дори още по-надалеч и дава на скриптовете на Perl достъп до всички „вътрешности“ на самия Apache сървър, като им позволява да се намесват във всеки един етап от доставянето на HTML страницата, както и да използват конструкции на Perl в конфигурационните файлове на Apache.

Използване на командния интерпретатор[редактиране | edit source]

Името на главният изпълним файл (т.е. интерпретатора на езика, който превръща текстовия код на Perl в изпълними инструкции за процесора) е същото като името на програмния език, но обикновено се пише с малка буква — perl в *nix системи или perl.exe в Уиндоус системи. Този изпълним файл може да се използва за бързи изпълнения от командния ред на кратки програми наречени one-liners, който биха отнели много редове (и вероятно време) ако биха били написани на други програмни езици.

Изпълнение на Perl програма съхранена във файл с име my_program.pl

perl ./my_program.pl

или само ./my_program.pl, ако файлът е изпълним (chmod +x my_program.pl) и започва с директивата #!/usr/bin/perl, или подобна, т.е оказваща пътя до perl (само под *nix).


едно-редови изрази ( от англ. one-liners):

# Стартира дебъгера на Perl за "празната програма", който може да бъде използван като shell / REPL (read-evaluate-print loop)
perl -de0
# Отваря всички файлове от типа *.с и променя foo на bar.
perl -p -i.bak -e 's/\bfoo\b/bar/g' *.c
# Извежда само първите 50 реда от файловете f1, f2, f3.
perl -pe 'exit if $. > 50' f1 f2 f3
# Изтрива първите 10 реда на файла foo.txt.
perl -i.old -ne 'print unless 1 .. 10' foo.txt
# Променя последователността на редовете във файловете f1, f2, f3.
perl -e 'print reverse <>' f1 f2 f3
# Променя последователността на абзаците във файловете f1, f2, f3.
perl -00 -e 'print reverse <>' f1 f2 f3
# Изтрива всички други редове освен тези между реда започващ със START и този започващ с END включително във файл foo.txt.
perl -i.old -ne 'print if /^START$/ .. /^END$/' foo.txt

Недостатъци на езика[редактиране | edit source]

Противниците на Perl твърдят, че той има много неясен и дори откровенно грозен синтаксис, дължащ се на редицата синтактични съкращения, целящи пестене на време при писане на едноредови команди (one-liners), и вградените оператори за работа с регулярни изрази, които значително улесняват работата със символни низове, за сметка на загадъчният си запис. Мотото на езика „Има повече от един начин да го направиш“ („There Is More Than One Way To Do It.“, съкратено TIMTOWTDI), е друг аргумент на противниците на Perl, както и слабата типизация (която всъщност е една от силните страни на Perl).

Използването на основен набор от правила и конвенции при писането на код, като например тeзи използвани в документацията на Perl, лесно неутрализират всички синтактични особици.

Здравей, свят![редактиране | edit source]

Програмата извеждаща „Здравей, свят!“, реализирана на Perl:

print "Здравей, свят!\n";


Вградени типове данни[редактиране | edit source]

Вградените типове данни на Perl се обозначават с помоща на сиджил (символ използван, като префикс, т.е преди името на променливата), който също така представлява и минималистична унгарска нотация:

  • Скалар - използва сиджил '$', представлява единична стойност, която може да бъде число, символен низ или препратка (или още референция от англ. reference)
  • Масив - използва сиджил '@', представлява списък от скалари, означавани (т.е. номерирани) последователно, като масивите в Perl са 0-ла базирани, но това може да бъде променияно, но е силно непрепоръчително. Поредният номер на даден елемент от масива се нарича индекс. Достъпът до отделни елементи от масива използва подобен на езика C синтаксис: $<име_на_масив>[<индекс>].
  • Хеш - използва сиджил '%', (наричан още хеш-таблица или асоциативен масив) е множество от подредени двойки скалари. Като двойките помежду си нямат подредба или номерация, т.е. образуват математическо множество. Елементите на една конкретна двойка обаче са подредени, т.е. има първи и втори: Първият се нарича ключ (на англ. key), а вторият стойност (на англ. value). И двата скалара могат да бъдат произволни и няма нужда да са от един и същи тип. Достъпът до отделни стойности от хеша става чрез ключовете. В известен смисъл ключовете при хеша съответстват на индексите при масива. В това отношение хешът може да се разглежда като по-обща форма на масив, при която индексите не са ограничени до числа, а могат да бъдат произволни скалари. Тъй като ключовете се използват за идентификация на стойностите в хеша, те трябва да са уникални, т.е. да няма повторения. За разлика от тях, стойностите могат да се повтарят — на различни ключове могат да съответстват едни и същи стойности. Достепът до стойностите на хеша използва ситанксиса: $<име_на_хеш>{име_на_ключ}.
  • Файлов манипулатор - няма определен сиджил, наричан още файлов дескриптор (от англ. file descriptor или file handle), този тип променливи предоставя достъп до файл или друго поточно устройство, като например мрежова връзка, тръба (от англ. pipe), и т.н. Файловият дескриптор може да бъде отворен за писане, четене или и за двете.
  • Подпрограма - използва сиджил '&'. Подпрограмата (subroutine, позната още и като функция (на анлг. function) е последователност от инструкции, на който могат да се предават аргументи, извършващи някакво действие с тях и/или пресмята резултат, и накрая евентуално връща стойност (обикновено пресметнаия резултат, или нищо, ако няма такъв).
  • Typeglob - използва сиджил '*', и представлява тип данни който предоставя достъп до символните таблици в езика Perl.


Кратки примери:

# При декларирането на променливи в езика Perl се използва ключовата дума 'my'
# подобно на ключовата дума 'var', срещаща се в други езици.
 
 
# Деклариране на скаларни променливи.
#
my $name = "Янко";
my $number = 9;
print "$name #$number\n";
 
# извежда: Янко #9
 
 
# Деклариране на масив.
#
my @names = ("Иван", "Петър", "Георги");
print "$names[0], $names[2] и $names[1]\n";
 
# oтпечатва: Иван, Георги и Петър
 
 
# Деклариране на хеш.
#
my %hash = (
   'name'    => 'Иван',
   'surname' => 'Георгиев',
   'city'    => 'София',
);
 
print "Име: $hash{'name'}\nФамилия: $hash{'surname'}\nМестожителство: $hash{city}\n";
 
# извежда:
# Име: Иван
# Фамилия: Георгиев
# Местожителство: София
 
 
# Отваряне на файл за четене.
#
open my $file, '<', '/home/georgi/file.txt';
my @line = <$file>; # Всеки ред на файла се записва като отделен елемент на масива.
close $file;
 
 
# Деклариране на функция / подпрограма.
#
sub count_to {
    my $n = $_[0]; # Аргументите се предават в специалния масив @_.
    for ($i = 1; $i <= $n; $i++) {
        print"Мога да броя до $i!\n";
    }
}
 
# Скобите са незадължителни при извикването на функции, стига
# нейната дефиниция да е преди употребата й, но неизползването на скобите
# e добре да бъде прилагано само за вградените функции.
#
count_to 4;
 
# oтпечатва:
# Мога да броя до 1!
# Мога да броя до 2!
# Мога да броя до 3!
# Мога да броя до 4!
 
# Отпечатва абсолютно същото, но е препоръчително
# сиджила за функции, да бъде използван само, когато е нужна
# рефенреция към функция.
&count_to(4);
 
 
# Съхранява референция към функция в скалар.
my $count_to_ref = \&count_to;
 
# Извикването на тази референция става, като първо диреференцираме, или използваме записа с ->.
&$count_to_ref(10);
$count_to_ref->(10);
 
# Когато се използват затваряния (closure), се използват тъкмо референции към аниномни функции
#
my $pow_generator = sub {
    my $p = $_[0];
 
    return sub {
        my $b = $_[0];
        return $b ** $p; # b^p
    };
};
 
my $pow3 = $pow_generator->(3);
print $pow3->(2), "\n"; # извежда: 8 = 2^3


Основни контролни структури[редактиране | edit source]

Контролните структури в Perl могат да се записват по два начина. При първият кодът, който ще се изпълнява, е разположен на произволен брой редове, при другия - само на един. За разлика от езика C, в Perl е задължителна употребата на фигурни скоби за структурите използващи един единствен оператор.

Условни структури[редактиране | edit source]

if[редактиране | edit source]

Кода се изпълнява само ако условието се изпълни:

my $today = "понеделник";
 
if ($today eq "понеделник") {
   print "Днес е понеделник!\n";
}
 
# извежда: Днес е понеделник!

Едноредов вариант:

my $today = "понеделник";
print "Днес е понеделник!\n" if $today eq "понеделник"; # Скобите на структурите от този вид са незадължителни.

if-elsif-else

my $today = "сряда";
if ($today eq "понеделник") {
   print "Днес е понеделник!\n";
} elsif ($today eq "вторник") {
   print "Днес е вторник!\n";
} elsif ($today eq "сряда!") {
   print "Днес е сряда!\n";
} elsif ($today eq "четвъртък") {
   print "Днес е четвъртък!\n";
} elsif ($today eq "петък") {
   print "Днес е петък!\n";
} else {
   print "Днес е почивен ден!\n";
}
 
# извежда: Днес е сряда!

unless[редактиране | edit source]

unless е обратната на if, и еквивалентна на if not. Кода се изпълнява когато условието пропадне.

my $today = "понеделник";
print "Днес е делник!" if not $today eq "събота" || $today eq "неделя";
# извежда: Днес е делник!


Циклични структури[редактиране | edit source]

Всички примери извеждат цифрите от 0 до 9.

while[редактиране | edit source]

При while кодът се изпълнява докато условието не се провали.

my $i = 0;
while ($i <= 9) {
   print "$i\n";
   $i = $i + 1; # може да се запише съкратено $i++;
}

for[редактиране | edit source]

for цикъл в стил C, който рядко се използва в Perl

for (my $i = 0; $i <= 9; $i++)
{
    print "$i\n";
}

foreach[редактиране | edit source]

Ключовата дума foreach, е синоним на for

foreach my $i (0 .. 9) # бинарният оператор '..' връща масив с елементите от интервалa [$a, $b], записан като $a .. $b
{
    print "$i\n";
}


За прекъсване на цикъл или итерация (изпълнение) се използват:

  • last - прекъсва изпълнението на цикъла
  • next - преминава на следващата итерация
my $count_to = 10;
my $counted_to = 0;
 
while ($counted_to <= $count_to) {
   $counted_to++;
   next if $counted_to == 3;
   print "$counted_to ";
   last if $counted_to == 5;
}

Тази програма трябва да брои от 1 до 10 според условието в while, но числото 3 не се извежда, защото при всяка итерация се прави проверка дали $counted_to не е 3, ако е, се пропуска. Също така цикъла няма да стигне никога до 10, защото когато стигне 5, ще се изпълни last и цикъла ще прекъсне.


Цикличните структури в Perl, са превъзхождат тези в езика C, тъй като те могат да бъдат "именувани" с етикети и позволяват излизане от дълбоко вмъкнати един в друг циккли:

my $i = 0;
OUTER:
while ($i < 10)
{
    print "\$i = $i\n";
    MIDDLE:
    for (my $j = 0; $j < 10; $j++)
    {
        print "\$j = $j\n";
        INNER:
        for my $k (0 .. 9)
        {
            print "\$k = $k";
            next MIDDLE if $i == 6;
        }
 
        last OUTER if $j == 2;
    }
    $i++;
}


Поeзия в Perl[редактиране | edit source]

На Perl можe даже да се пишат стихотворения. Едно такова стихотворение с название «Black Perl» («Черен бисер/перла/» ) е било цитирано от Лари Уол в първо априлско писмо в Usenet. То било написано поначало на Perl 3, и по думите на самия Лари, той изпитал морално удовлетворение, когато стихотворението не извадило грешки в синтактически анализатор на Perl 5. Лари е известен и с миролюбовта си, и протеста срещу милитаристичната политика на големите държави.

 BEFOREHEAD: close door, each window & exit; wait until time.
 open spellbook, study, read (scan, select, tell us);
 write it, print the hex whole each watches,
 reverse its length, write again;
 kill spiders, pop them, chop, split, kill them.
 unlink arms, shift, wait & listen (listening, wait),
 sort the flock (then, warn the "goats" & kill the "sheep");
 kill them, dump qualms, shift moralities,
 values aside, each one;
 die sheep! die to reverse the system
 you accept (reject, respect);
 next step,
 kill next sacrifice, each sacrifice,
 wait, redo ritual until "all the spirits are pleased";
 do it ("as they say").
 do it(*everyone***must***participate***in***forbidden**s*e*x*).
 return last victim; package body;
 exit crypt (time, times & "half a time") & close it,
 select (quickly) & warn your next victim;
 AFTERWORDS: tell nobody,


Инсталация[редактиране | edit source]

Perl е част от всяка Юникс или Юникс-подобна система. Това може да бъде проверено с изпълнението на командата perl -v в шела. За Уиндоус програмната среда може да бъде безплатно свалена от сайта на ActiveState или сайта на Strawberry Perl - дистрибуция съдържаща dmake, която улеснява инсталацият на модули изискващи make под Unix. Всяка стандартна инсталация на програмната среда може да бъде допълвана с най-различни модули от сайта на CPAN, голяма част от които функционират на различни операционни системи.


Документация[редактиране | edit source]

Документацията на Perl изобилства от шеги и игри на думи, за разлика от сухия език на повечето компютърна литература, а годишните обръщения на Лари („State of the Onion“, каламбур с обръщението на президента на САЩ, „State of the Union“) са ненадминати образци на духовитост.

Въпреки шеговитият си характер, документацията на езика е изключително пълна и най-важното общодостъпна. С командата perldoc <име на модул> се извежда помощта за съответния модул. Онлайн документацията изобилства с примери и указания дори и за начинаещи в езика.


Литература[редактиране | edit source]

Най-популярната книга за Perl е написана от автора му и е известна сред феновете на езика като „камилата“ заради картинката на обложката си.

  • Уол, Лари и др. Програмиране с Perl. ЗеСТ Прес, 2002. ISBN 978-954-90498-8-6.
  • Бланк-Еделман, Дейвид. Perl за системно администриране. ЗеСТ Прес, 2002. ISBN 978-954-91165-3-3.
  • Кристиансен, Том и др. Perl Cookbook. ЗеСТ Прес, 2005. ISBN 978-954-93410-6-5.
  • Казънс, Саймън и др. Програмиране с Perl. Софтпрес, 2001. ISBN 978-954-685-138-3.


Външни препратки[редактиране | edit source]