Уравнение

от Уикипедия, свободната енциклопедия
Направо към навигацията Направо към търсенето

Най-старото известно уравнение, публикувано през 1557 година от Робърт Рекърд, който въвежда и знака „=“ за означаване на равенство[1]
Динамичните системи се описват с уравнения, чиито решения са функции, като изобразения на графиката странен атрактор

Уравнението е математическо равенство, съдържащо една или повече променливи. Решаването на уравнението се състои в намирането на стойностите на променливите, за които равенството би било изпълнено. Променливите се наричат също неизвестни, а стойностите, за които равенството е изпълнено – решения на уравнението. За разлика от тъждеството, уравнението е равенство, което не е задължително да бъде изпълнено за всички възможни стойности на променливата.[2]

Съществува голямо разнообразие от уравнения, които намират приложение в различни области на математиката, като методите за тяхното решаване се различават, в зависимост от вида на уравнението.

В алгебрата се разглеждат две основни групи уравнения – полиномните уравнения и системите линейните уравнения. Полиномните уравнения имат общия вид P(X) = 0, където P е полиномна функция, а системите линейни уравнения – a(x) + b = 0, където a линейно изображение, а b и неизвестното x са вектори. За решаването на алгебричните уравнения се използват алгоритмични или геометрични методи, базирани на линейната алгебра или математическия анализ.

Алгебрата изследва и диофантовите уравнения, при които коефициентите и решенията са цели числа, като при тях се използват различни методи, основани на аритметиката. Тези уравнения обикновено са трудни и най-често при тях се търси само дали съществуват решения и какъв е техния брой.

В геометрията уравненията се използват за описване на различни геометрични обекти. Тук целта не е намирането на решения, а демонстрирането и изследването на определени геометрични свойства. В тази област приложение намират две големи групи уравнения – декартови и параметрични.

Математическият анализ изследва уравнения от вида f(x) = 0, където f е функция с определени свойства, като непрекъснатост и диференцируемост. Методите за решаване на тези уравнения дават възможност за конструиране на сходящи поредици от решения, като целта е да се достигне до възможно най-точното решение.

Динамичните системи се дефинират чрез уравнения, чиито решения са редици или функции на една или повече променливи. В този контекст се разглеждат два основни въпроса – за началното състояние и за асимптотичното поведение. За всяко допустимо начално състояние, например стойността на редицата или функцията в нулата, уравнението допуска определено единствено решение. Чувствителността на решенията към малки промени в началното състояние е една от основните задачи. Асимптотичното поведение на дадено решение е формата на решението при стойности на променливата, клонящи към безкрайност. Ако решението не е разходящо, то може да клони към дадена стойност, да има цикличен характер или да има хаотично поведение.

Общи сведения[редактиране | редактиране на кода]

Неизвестни, решения, тъждествени преобразувания[редактиране | редактиране на кода]

Следният пример е взет от книгата „Китаб ал-джабр уал-мукабала“ на Мохамед ал-Хорезми, един от основоположниците на алгебрата[3]
Един човек умрял и оставил четирима синове и направил на един човек дарение, равно на дела на един от синовете си, и на друг четвърт от разликата между една трета от наследството и първото дарение.

Ако x е неизвестното, в случая – делът от наследството, което получава всеки един син, задачата се преобразува в следното уравнение, в което стойността 1 вдясно обозначава 1 наследство:

В примера формулираното уравнение означава, че равенството (1) е тъждествено на описаната задача. За да се получи отговора, трябва да се определи единствената стойност на неизвестното x, за която равенството е изпълнено – решение (или корен) на уравнението. Манипулирането на неизвестното дава възможност за решаване на някои уравнения, като представеното тук. Това става чрез преобразуване на уравнението в друго, което е тъждествено на първоначалното.

Две уравнения са тъждествени, ако имат едно и също дефиниционно множество и едни и същи корени. Основните тъждествени преобразувания (начини за получаване на тъждествено на дадено уравнение) са:

  • Размяна на двете страни на равенството
  • Добавяне към двете страни на равенството на един и същ аритметичен израз, който не стеснява дефиниционното множество
  • Умножаване на двете страни на равенството с един и същ аритметичен израз, който е различен от 0 и не стеснява дефиниционното множество (например, умножението с 1/x на уравнение от вида 5x = 0 не е тъждествено преобразувание, защото изключва 0 от дефиниционното множество на променливата x)
  • Степенуване на двете страни на равенството с една и съща степен, която не стеснява дефиниционното множество

Решаването на уравнението в примера може да стане по следния начин:

  • Опростяване на израза вляво

  • Добавяне на -1/12 към двете страни на равенството

  • Умножаване с 4/19 на двете страни на равенството

Параметри[редактиране | редактиране на кода]

Параметри в уравненията са променливи, които за разлика от неизвестните могат да присъстват и в решението. Такива уравнения се наричат параметрични и са използвани за пръв път през 16 век от Франсоа Виет като средство за общо решаване на цели групи уравнения,[4] като тези в следния пример:

Пример за параметрично уравнение[5]
Графиката на функцията f е парабола, показана в синьо на схемата, графиката на g1(x) е правата в червено, тази на g-2(x) – във виолетово и тази на g-1 – в зелено

Търси се броят на реалните корени на следните уравнения:

Задачата може да се реши, като се въведе функцията f(x), която съпоставя на всяко x стойността x2. Нейната графика е квадратна парабола, показана в синьо на схемата вдясно. Функцията g1(x) съпоставя на x стойността 2.x +1 (червената права). Корените на уравнение (1) са абсцисите на пресечните точки на параболата и червената права, като графичното представяне показва, че съществуват две решения, съответстващи на двете пресечни точки. За решаването на уравнение (2) се въвежда функцията g-2(x), която съпоставя на x стойността 2.x -2 (виолетовата права). Тя не пресича параболата, което означава, че уравнението няма решение. В последния случай се въвежда функцията g-1(x), която съпоставя на x стойността 2.x -1 (зелената права). Нейната графика е права, успоредна на първите две, която има една обща точка с параболата и съответно третото уравнение има едно решение.

Задачата може да се реши по по-общ начин, като в уравненията се въведе параметър a, който може да заема произволни стойности, а трите уравнения се разглеждат като частни случаи при стойности на параметъра a 1, -2 и -1:

<

Уравнение (4) се нарича параметрично уравнение, а променливата a – параметър.

Алгебра[редактиране | редактиране на кода]

Полиномни уравнения[редактиране | редактиране на кода]

Графиката на полинома X5 - 3X + 2 показва, че той има поне четири корена (петият не се вижда на тази графика), и илюстрира основната теорема на алгебрата в този частен случай

Основна категория уравнения, изследвани от алгебрата, са полиномните уравнения, които имат общия вид:

където an ≠ 0, а стойността n се нарича степен на уравнението.

Наличието на добре разработени методи за решаването на полиномни уравнения дава възможност за решаването чрез подходяща замяна на неизвестното и на други групи уравнения. Например, уравнението e2x - (ea + eb)ex + ea+b = 0 може да бъде трансформирано в полиномно уравнение от втора степен чрез полагането X = ex.

Решаването на полиномните уравнения от първите няколко степени е сравнително просто. При уравненията от първа степен (линейни уравнения) решението е:

При уравненията от втора степен (квадратни уравнения) корените също може да се получат в явен вид, когато коефициентите и корените са реални числа:

където условието за реалност на корените е стойността под квадратния корен, наричана дискриминанта, да бъде по-голяма или равна на нула.

Решаването на полиномните уравнения от трета степен (кубични уравнения) е по-сложна задача. Италианските математици през Ренесанса установяват, че получаването на общо решение изисква добавянето към множеството на числата на имагинерните числа.[6] Това откритие дава възможност за формулирането на затворени решения на уравненията от трета и четвърта степен – съответно формула на Кардано и формула на Ферари.

По-късно е изведена и основната теорема на алгебрата, според която всяко полиномно уравнение от степен по-голяма от нула и с реални или комплексни коефициенти има поне един комплексен корен. Макар че тази теорема гарантира съществуването на решение за много широк кръг полиномни уравнения, тя не предлага явно решение, а наличието на комплексни корени на уравненията с реални коефициенти не е интуитивно очевидно. Теоремата на Абел-Руфини дава обяснение на този факт, като показва, че за полиномните уравнения от по-висока степен не съществува обща формула, подобна на тези за уравненията до четвърта степен. Този извод, до който достига Нилс Абел, е допълнен от Еварист Галоа, който извежда необходимото и достатъчно условие за наличие на решение от подобен вид на полиномните уравнения. В историята на математиката основната теорема на алгебрата и теоремата на Абел-Руфини образуват популярната през 19 век теория на уравненията, която днес не се разглежда като самостоятелна област на математиката.

Системи линейни уравнения[редактиране | редактиране на кода]

„Дзиуджан Суаншу“, китайска книга от 2 век пр.н.е., описваща вариант на метода на Гаус за решаване на системи линейни уравнения

Друга група уравнения, изследвани от алгебрата, са векторните линейни уравнения от вида:

където a е линейно изображение на векторното пространство E във векторното пространство F, b е вектор от пространството F, а x е променлива, дефинирана в пространството E.

Ако пространствата E и F са с крайна размерност, съответно n и m, изборът на база на E и F дава възможност изображението a да се представи под формата на матрица (ajk), x – под формата на вектор стълб с n координати (xk) и b – като вектор стълб с m координати (bj). Така векторното линейно уравнение може да бъде записано като система от линейни уравнения:

Системите линейни уравнения намират широко приложение в науката и техниката, често в методи за приблизително решаване на диференциални уравнения, поради което съществуват множество методи за тяхното решаване. В случая, когато размерностите n и m са равни и детерминантата на матрицата a е различна от нула, решението на системата може да бъде получено в явен вид чрез метода на Крамер. Този начин за решаване на системите е неефективен и в практиката по-често се използват итерационни алгоритми, като метода на Гаус.[7] Неговата цел е да отдели отделните неизвестни, като чрез поредица тъждествени преобразувания получи линейни уравнения с едно неизвестно. Методът на Гаус е известен още през Древността. Негов вариант е описан в Глава 8 на китайската математическа книга от 2 век пр.н.е. „Дзиуджан Суаншу“.[8]

Геометрична интерпретация на линейните уравнения[редактиране | редактиране на кода]

Геометрията дава възможност за създаване на по-ефективни алгоритми за решаване на линейни уравнения. Схемата показва триизмерно изображение на функцията f.
Схема на хоризонталите на функцията f. Червената и зелената отсечка показват пътя на приблизително решение, което се извършва с две итерации в двуизмерния случай.

Геометричната интерпретация на системите линейни уравнения дава допълнителна информация за техния характер. Изображението на линейния оператор a образува векторно подпространство, подобно на равнината в триизмерното пространство. Ядрото на a (векторите от дефиниционното множество, чието изображение е нулевият вектор) също е подпространство. Тези резултати показват, че множестовото от решенията образува афинно пространство.

Този подход дава възможност за създаване на алгоритми за решение, които отчитат характерните особености на a. В някои частни случаи съществуват методи, позволяващи по-бързото намиране на решение, отколкото чрез метода на Гаус. Например, възможно е да не се търси пряко решение на уравнението a.x + b = 0, а да се отговори на друг въпрос, привидно по-сложен – да се намери екстремума на f(x), дефинирана като:

Този екстремум е и решението на системата линейни уравнения. За да се разбере методът на решение, най-просто е да се разгледа случаят с две измерения – графиката на f има овална форма, както е показано на схемата вляво. Ако се тръгне от произволна точка x0 и се следва кривата с най-голям наклон (показана като червена парабола на схемата вляво и като червена отсечка на схемата вдясно), най-високата точка се означава като x1. От точка x1 отново се следва кривата с най-голям наклон, показана в зелено на схемите. Този алгоритъм се нарича метод на най-бързото изкачване. Ако вместо да се следва точно пътя на най-големия наклон, се избере посока, ортогонална на предходните посоки, методът дава решение за максимум n стъпки, където n е броят на измеренията на E.

Геометрия[редактиране | редактиране на кода]

Аналитична геометрия[редактиране | редактиране на кода]

Коничните сечения са криви, представляващи сечение на кръгов конус и равнина

В евклидовата геометрия е възможно всяка точка от пространството да се съпоставят определени координати, например чрез използването на ортонормален базис. Този подход дава възможност геометричните фигури да бъдат описвани с помощта на уравнения. Така например, равнина в триизмерното пространство може да се опише като съвкупността от решенията на уравнение от вида a.x + b.y + c.z + d = 0, където a, b, c и d са реални числа, а неизвестните x, y и z са координатите на точките от равнината в избраната координатна система. Числата a, b и c са координати на вектор, перпендикулярен на описваната от уравнението равнина. Правата се дефинира като сечение на две равнини и може да се опише като съвкупността от решенията на линейно уравнение със стойности в ℝ2 или на система от две линейни уравнения със стойности в ℝ, където ℝ е множеството на реалните числа.

Коничните сечения представляват сечения на конус с уравнение x2 + y2 = z2 и равнина – в пространството всяко конично сечение се дефинира като множеството от точки, чиито координати са решения на уравнение на равнина и на посоченото уравнение. Тази форма дава възможност да се определи положението и свойствата на фокусите на коничните сечения.

Декартовото уравнение на окръжността дава възможност за проста демонстрация на теоремата на Талес

С използването на този подход могат да се получат и уравнения, чиято цел не е изразяването на решения, подобни на току що описаните. Пример за това е теоремата на Талес, според която един триъгълник е правоъгълен, ако една от страните му е диаметър на описаната около него окръжност. При подходящ избор на правоъгълна координатна система уравнението на окръжността може да се опише като: x2 + y2 = 1, а точките A и C на схемата вдясно имат координати съответно (-1,0) и (1,0). Ако AB е перпендикулярна на CB, съответните вектори също трябва да са ортогонални. Така с помощта на уравнението на окръжността е лесно да се покаже верността на теоремата:

Използването на уравнения дава нови възможности за разрешаване на геометрични задачи. С превръщането на геометричните фигури в уравнения декартовата координатна система преобразува геометричната задача в аналитична, откъдето идва и наименованието на цялата математическа дисциплина – аналитична геометрия. Този подход, демонстриран от Рене Декарт, обогатява и напълно преобразява известната от Античността геометрия.

В наши дни аналитичната геометрия е активно развиващ се клон на математиката. В нейната основа продължава да бъде използването на уравнения за описване на геометрични обекти, но тя прилага и по-сложни методи, базирани на функционалния анализ и линейната алгебра.

Декартови и параметрични уравнения[редактиране | редактиране на кода]

Представянето на геометрични фигури като уравнения обикновено става по един от два основни метода. При първия се използва уравнение от вида f(x) = 0, където f е функция от евклидовото пространство E с размерност n в ℝd, а d е естествено число, по-малко от n. Ако f е достатъчно правилна функция, n - d е размерността на геометричната фигура – ако тя е 1, фигурата е крива, при 2 тя е повърхнина и т.н. Такова уравнение може да се представи и като система от d уравнения с реални корени. Този вид уравнения се наричат декартови, ако x е представено чрез координати в декартова координатна система. Всички уравнения в предходния раздел са декартови.

Другият често използван метод се състои в описването на геометричните фигури с помощта на функция f от ℝd в E по такъв начин, че една точка m в E е елемент на фигурата, когато съществува точка x в дефиниционното множество на функцията f, за която f(x) е равно на m. В този случай и при достатъчна правилност на f описаната фигура има размерност d, а уравнението се нарича параметрично. Например, единичната окръжност може да се опише с параметъра θ и параметричните уравнения:

Ако описваната фигура е достатъчно правилна, например, ако поне локално съответства на дадено многообразие, то е възможно тя да се параметризира. В този контекст локално означава, че ако m е елемент на фигурата, съществува функция f и околност V на точка от дефиниционното множество f, такава че изображението на f остава част от фигурата и такова че изображението на V от f е околност на m във фигурата.

Теория на числата[редактиране | редактиране на кода]

Диофантови уравнения[редактиране | редактиране на кода]

След многовековни усилия на математическата общност Давид Хилберт пръв успява да намери решение на диофантовото уравнение от втора степен

В исторически план първите формализирани уравнения имат аритметичен характер и датират от 3 век.[9] Ако решението на дадено уравнение се търси не като произволно число, а като цяло число, и ако уравнението е с цели коефициенти, то се нарича диофантово.[10] Описаните по-горе методи по принцип не са достатъчни за решаването на тази група уравнения, за сметка на това са изключително полезни методите на аритметиката. Относително прост пример е линейното диофантово уравнение с две неизвестни a.x + b.y = c.

С увеличаването на степента на диофантовото уравнение решаването му става далеч по-сложно. Дори уравнението от втора степен далеч не е просто в общия случай (вижте например Теорема на Ферма-Ойлер или Уравнение на Пел). Чрез използването на специално създадени за тази цел методи и предпоставки, като метода на безкрайното спускане и малката теорема на Ферма, става възможно да се решат някои частни случаи.

Общото решение на уравнението от втора степен изисква използването на по-сложни методи, като тези на алгебричната теория на числата. Необходими са по-детайлни представи за числовите множества и изследване на крайни полета и цели алгебрични числа с помощта на теорията на Галоа. Така докато решение на алгебричното уравнение от втора степен е намерено от Хорезми още през 8 век, аналогичното диофантово уравнение е решено едва в края на 19 век от Давид Хилберт. Анализът на диофантовите уравнения често е толкова сложен, че се ограничава до определянето на съществуването на решения и техния брой.

Диофантовите уравнения намират широко приложение в областта на информатиката. Инструменти, основани на техния анализ, дават възможност за откриване и поправяне на грешки и са в основата на алгоритмите на криптологията. В основата на много шифри стоят диофантови уравнения, които се описват просто, но чието решаване изисква практически недостижимо време за обработка. Например, уравнението n = x.y, където n е фиксирано естествено число, а x и y са неизвестните, не може да се реши практически, ако n е произведение на две достатъчно големи прости числа. Това уравнение е основата на популярния алгоритъм за шифриране RSA.[11]

Алгебрични и трансценденти числа[редактиране | редактиране на кода]

Алгебрична геометрия[редактиране | редактиране на кода]

Математически анализ[редактиране | редактиране на кода]

Динамични системи[редактиране | редактиране на кода]

Бележки[редактиране | редактиране на кода]

  1. Robert Recorde. // www-gap.dcs.st-and.ac.uk. School of Mathematics and Statistics, University of St Andrews, Scotland, 2002. Посетен на 5 юли 2011. (на английски)
  2. Lachaud, Gilles. Équation, mathématique. // Encyclopædia Universalis. Encyclopædia Universalis, 2011. Посетен на 5 юли 2011. (на френски)
  3. Rosen, Frederic (ed.). The algebra of Mohammed ben Musa. London, Oriental Translation Fund, 1831. p. 104. (на английски)
  4. Guichard, J. P.. Viète inventeur de l'algèbre nouvelle. // CultureMATH. cc-parthenay.fr, 2007. Посетен на 6 юли 2011. (на френски)
  5. Vandebrouck, F. Introduction de la notion de paramètre au lycée avec un logiciel de géométrie dynamique ou une calculatrice graphique (PDF). // univ-irem.fr. univ-irem.fr, 2011. Посетен на 6 юли 2011. (на френски)
  6. Freguglia, P.. Sur la théorie des équations algébriques entre le XVI et le XVIIème siècle. // Bollettino di storia delle scienze matematiche 14 (2). 1994. p. 259 – 298. (на френски)
  7. Méthode du pivot de Gauss. // La BibM@th. La BibM@th, 2011. Посетен на 7 юли 2011. (на френски)
  8. Chemla, K. et al. Les neuf chapitres: le classique mathématique de la Chine ancienne et ses commentaires. Paris, Dunod, 2004. ISBN 2100077783. (на френски)
  9. XII. La première inconnue… (PDF). // irem.univ-poitiers.fr. IREM de Poitiers, 2012. p. 27. Посетен на 6 ноември 2012. (на френски)
  10. Dieudonné, Jean. Abrégé d'histoire des mathématiques, 1700 – 1900. 1986. p. 227. (на френски)
  11. Rivest, R. et al. A Method for Obtaining Digital Signatures and Public-Key Cryptosystems. // Communications of the ACM 21 (2). 1978. p. 120 – 126. (на английски)

Вижте също[редактиране | редактиране на кода]