Условия куна таккера в геометрической форме. Формулировка и доказательство теоремы куна-таккера. Более слабые условия

Существуют три основных системы координат, используемых в геометрии, теоретической механике, других разделах физики: декартова, полярная и сферическая. В этих системах координат вся точка имеет три координаты. Зная координаты 2-х точек, дозволено определить расстояние между этими двумя точками.

Вам понадобится

  • Декартовы, полярные и сферические координаты концов отрезка

Инструкция

1. Разглядите для начала прямоугольную декартову систему координат. Расположение точки в пространстве в этой системе координат определяется координатами x,y и z. Из начала координат к точке проводится радиус-вектор. Проекции этого радиус-вектора на координатные оси и будут координатами этой точки.Пускай у вас сейчас есть две точки с координатами x1,y1,z1 и x2,y2 и z2 соответственно. Обозначьте за r1 и r2, соответственно, радиус-векторы первой и 2-й точки. Видимо, что расстояние между этими двумя точками будет равно модулю вектора r = r1-r2, где (r1-r2) – векторная разность.Координаты вектора r, видимо, будут следующими: x1-x2, y1-y2, z1-z2. Тогда модуль вектора r либо расстояние между двумя точками будет равно: r = sqrt(((x1-x2)^2)+((y1-y2)^2)+((z1-z2)^2)).

2. Разглядите сейчас полярную систему координат, в которой координата точки будет задаваться радиальной координатой r (радиус-вектор в плоскости XY), угловой координатой? (углом между вектором r и осью X) и координатой z, аналогичной координате z в декартовой системе.Полярные координаты точки дозволено перевести в декартовы дальнейшим образом: x = r*cos?, y = r*sin?, z = z. Тогда расстояние между двумя точками с координатами r1, ?1 ,z1 и r2, ?2, z2 будет равно R = sqrt(((r1*cos?1-r2*cos?2)^2)+((r1*sin?1-r2*sin?2)^2)+((z1-z2)^2)) = sqrt((r1^2)+(r2^2)-2r1*r2(cos?1*cos?2+sin?1*sin?2)+((z1-z2)^2))

3. Сейчас разглядите сферическую систему координат. В ней расположение точки задается тремя координатами r, ? и?. r – расстояние от начала координат до точки, ? и? – азимутальные и зенитный угол соответственно. Угол? аналогичен углу с таким же обозначением в полярной системе координат, а? – угол между радиус-вектором r и осью Z, причем 0<= ? <= pi.Переведем сферические координаты в декартовы: x = r*sin?*cos?, y = r*sin?*sin?*sin?, z = r*cos?. Расстояние между точками с координатами r1, ?1, ?1 и r2, ?2 и?2 будет равно R = sqrt(((r1*sin?1*cos?1-r2*sin?2*cos?2)^2)+((r1*sin?1*sin?1-r2*sin?2*sin?2)^2)+((r1*cos?1-r2*cos?2)^2)) = (((r1*sin?1)^2)+((r2*sin?2)^2)-2r1*r2*sin?1*sin?2*(cos?1*cos?2+sin?1*sin?2)+((r1*cos?1-r2*cos?2)^2))

Видео по теме

Длина, как уже отмечалось, обозначается знаком модуля.

Если даны две точки плоскости и , то длину отрезка можно вычислить по формуле

Если даны две точки пространства и , то длину отрезка можно вычислить по формуле

Примечание: Формулы останутся корректными, если переставить местами соответствующие координаты: и , но более стандартен первый вариант

Пример 3

Решение: по соответствующей формуле:

Ответ:

Для наглядности выполню чертёж

Отрезок – это не вектор , и перемещать его куда-либо, конечно, нельзя. Кроме того, если вы выполните чертеж в масштабе: 1 ед. = 1 см (две тетрадные клетки), то полученный ответ можно проверить обычной линейкой, непосредственно измерив длину отрезка.

Да, решение короткое, но в нём есть ещё пара важных моментов, которые хотелось бы пояснить:

Во-первых, в ответе ставим размерность: «единицы». В условии не сказано, ЧТО это, миллиметры, сантиметры, метры или километры. Поэтому математически грамотным решением будет общая формулировка: «единицы» – сокращенно «ед.».

Во-вторых, повторим школьный материал, который полезен не только для рассмотренной задачи:

Обратите внимание на важный технический приём вынесение множителя из-под корня . В результате вычислений у нас получился результат и хороший математический стиль предполагает вынесение множителя из-под корня (если это возможно). Подробнее процесс выглядит так: . Конечно, оставить ответ в виде не будет ошибкой – но недочетом-то уж точно и весомым аргументом для придирки со стороны преподавателя.

Вот другие распространенные случаи:

Нередко под корнем получается достаточно большое число, например . Как быть в таких случаях? На калькуляторе проверяем, делится ли число на 4: . Да, разделилось нацело, таким образом: . А может быть, число ещё раз удастся разделить на 4? . Таким образом: . У числа последняя цифра нечетная, поэтому разделить в третий раз на 4 явно не удастся. Пробуем поделить на девять: . В результате:
Готово.

Вывод: если под корнем получается неизвлекаемое нацело число, то пытаемся вынести множитель из-под корня – на калькуляторе проверяем, делится ли число на: 4, 9, 16, 25, 36, 49 и т.д.

В ходе решения различных задач корни встречаются часто, всегда пытайтесь извлекать множители из-под корня во избежание более низкой оценки да ненужных заморочек с доработкой ваших решений по замечанию преподавателя.

Давайте заодно повторим возведение корней в квадрат и другие степени:

Правила действий со степенями в общем виде можно найти в школьном учебнике по алгебре, но, думаю, из приведённых примеров всё или почти всё уже ясно.


Задание для самостоятельного решения с отрезком в пространстве:

Пример 4

Даны точки и . Найти длину отрезка .

Решение и ответ в конце урока.

В статье ниже будут освещены вопросы нахождения координат середины отрезка при наличии в качестве исходных данных координат его крайних точек. Но, прежде чем приступить к изучению вопроса, введем ряд определений.

Yandex.RTB R-A-339285-1 Определение 1

Отрезок – прямая линия, соединяющая две произвольные точки, называемые концами отрезка. В качестве примера пусть это будут точки A и B и соответственно отрезок A B .

Если отрезок A B продолжить в обе стороны от точек A и B , мы получим прямую A B . Тогда отрезок A B – часть полученной прямой, ограниченный точками A и B . Отрезок A B объединяет точки A и B , являющиеся его концами, а также множество точек, лежащих между. Если, к примеру, взять любую произвольную точку K , лежащую между точками A и B , можно сказать, что точка K лежит на отрезке A B .

Определение 2

Длина отрезка – расстояние между концами отрезка при заданном масштабе (отрезке единичной длины). Длину отрезка A B обозначим следующим образом: A B .

Определение 3

Середина отрезка – точка, лежащая на отрезке и равноудаленная от его концов. Если середину отрезка A B обозначить точкой C , то верным будет равенство: A C = C B

Исходные данные: координатная прямая O x и несовпадающие точки на ней: A и B . Этим точкам соответствуют действительные числа x A и x B . Точка C – середина отрезка A B: необходимо определить координату x C .

Поскольку точка C является серединой отрезка А В, верным будет являться равенство: | А С | = | С В | . Расстояние между точками определяется модулем разницы их координат, т.е.

| А С | = | С В | ⇔ x C - x A = x B - x C

Тогда возможно два равенства: x C - x A = x B - x C и x C - x A = - (x B - x C)

Из первого равенства выведем формулу для координаты точки C: x C = x A + x B 2 (полусумма координат концов отрезка).

Из второго равенста получим: x A = x B , что невозможно, т.к. в исходных данных - несовпадающие точки. Таким образом, формула для определения координат середины отрезка A B с концами A (x A) и B (x B):

Полученная формула будет основой для определения координат середины отрезка на плоскости или в пространстве.

Исходные данные: прямоугольная система координат на плоскости О x y , две произвольные несовпадающие точки с заданными координатами A x A , y A и B x B , y B . Точка C – середина отрезка A B . Необходимо определить координаты x C и y C для точки C .

Возьмем для анализа случай, когда точки A и B не совпадают и не лежат на одной координатной прямой или прямой, перпендикулярной одной из осей. A x , A y ; B x , B y и C x , C y - проекции точек A , B и C на оси координат (прямые О х и О y).

Согласно построению прямые A A x , B B x , C C x параллельны; прямые также параллельны между собой. Совокупно с этим по теореме Фалеса из равенства А С = С В следуют равенства: А x С x = С x В x и А y С y = С y В y , и они в свою очередь свидетельствуют о том, что точка С x – середина отрезка А x В x , а С y – середина отрезка А y В y . И тогда, опираясь на полученную ранее формулу, получим:

x C = x A + x B 2 и y C = y A + y B 2

Этими же формулами можно воспользоваться в случае, когда точки A и B лежат на одной координатной прямой или прямой, перпендикулярной одной из осей. Проводить детальный анализ этого случая не будем, рассмотрим его лишь графически:

Резюмируя все выше сказанное, координаты середины отрезка A B на плоскости с координатами концов A (x A , y A) и B (x B , y B) определяются как :

(x A + x B 2 , y A + y B 2)

Исходные данные: система координат О x y z и две произвольные точки с заданными координатами A (x A , y A , z A) и B (x B , y B , z B) . Необходимо определить координаты точки C , являющейся серединой отрезка A B .

A x , A y , A z ; B x , B y , B z и C x , C y , C z - проекции всех заданных точек на оси системы координат.

Согласно теореме Фалеса верны равенства: A x C x = C x B x , A y C y = C y B y , A z C z = C z B z

Следовательно, точки C x , C y , C z являются серединами отрезков A x B x , A y B y , A z B z соответственно. Тогда, для определения координат середины отрезка в пространстве верны формулы:

x C = x A + x B 2 , y c = y A + y B 2 , z c = z A + Z B 2

Полученные формулы применимы также в случаях, когда точки A и B лежат на одной из координатных прямых; на прямой, перпендикулярной одной из осей; в одной координатной плоскости или плоскости, перпендикулярной одной из координатных плоскостей.

Определение координат середины отрезка через координаты радиус-векторов его концов

Формулу для нахождения координат середины отрезка также можно вывести согласно алгебраическому толкованию векторов.

Исходные данные: прямоугольная декартова система координат O x y , точки с заданными координатами A (x A , y A) и B (x B , x B) . Точка C – середина отрезка A B .

Согласно геометрическому определению действий над векторами верным будет равенство: O C → = 1 2 · O A → + O B → . Точка C в данном случае – точка пересечения диагоналей параллелограмма, построенного на основе векторов O A → и O B → , т.е. точка середины диагоналей.Координаты радиус-вектора точки равны координатам точки, тогда верны равенства: O A → = (x A , y A) , O B → = (x B , y B) . Выполним некоторые операции над векторами в координатах и получим:

O C → = 1 2 · O A → + O B → = x A + x B 2 , y A + y B 2

Следовательно, точка C имеет координаты:

x A + x B 2 , y A + y B 2

По аналогии определяется формула для нахождения координат середины отрезка в пространстве:

C (x A + x B 2 , y A + y B 2 , z A + z B 2)

Примеры решения задач на нахождение координат середины отрезка

Среди задач, предполагающих использование полученных выше формул, встречаются, как и те, в которых напрямую стоит вопрос рассчитать координаты середины отрезка, так и такие, что предполагают приведение заданных условий к этому вопросу: зачастую используется термин «медиана», ставится целью нахождение координат одного из концов отрезка, а также распространены задачи на симметрию, решение которых в общем также не должно вызывать затруднений после изучения настоящей темы. Рассмотрим характерные примеры.

Пример 1

Исходные данные: на плоскости – точки с заданными координатами А (- 7 , 3) и В (2 , 4) . Необходимо найти координаты середины отрезка А В.

Решение

Обозначим середину отрезка A B точкой C . Координаты ее буду определяться как полусумма координат концов отрезка, т.е. точек A и B .

x C = x A + x B 2 = - 7 + 2 2 = - 5 2 y C = y A + y B 2 = 3 + 4 2 = 7 2

Ответ : координаты середины отрезка А В - 5 2 , 7 2 .

Пример 2

Исходные данные: известны координаты треугольника А В С: А (- 1 , 0) , В (3 , 2) , С (9 , - 8) . Необходимо найти длину медианы А М.

Решение

  1. По условию задачи A M – медиана, а значит M является точкой середины отрезка B C . В первую очередь найдем координаты середины отрезка B C , т.е. точки M:

x M = x B + x C 2 = 3 + 9 2 = 6 y M = y B + y C 2 = 2 + (- 8) 2 = - 3

  1. Поскольку теперь нам известны координаты обоих концов медианы (точки A и М), можем воспользоваться формулой для определения расстояния между точками и посчитать длину медианы А М:

A M = (6 - (- 1)) 2 + (- 3 - 0) 2 = 58

Ответ: 58

Пример 3

Исходные данные: в прямоугольной системе координат трехмерного пространства задан параллелепипед A B C D A 1 B 1 C 1 D 1 . Заданы координаты точки C 1 (1 , 1 , 0) , а также определена точка M , являющаяся серединой диагонали B D 1 и имеющая координаты M (4 , 2 , - 4) . Необходимо рассчитать координаты точки А.

Решение

Диагонали параллелепипеда имеют пересечение в одной точке, которая при этом является серединой всех диагоналей. Исходя из этого утверждения, можно иметь в виду, что известная по условиям задачи точка М является серединой отрезка А С 1 . Опираясь на формулу для нахождения координат середины отрезка в пространстве, найдем координаты точки А: x M = x A + x C 1 2 ⇒ x A = 2 · x M - x C 1 = 2 · 4 - 1 + 7 y M = y A + y C 1 2 ⇒ y A = 2 · y M - y C 1 = 2 · 2 - 1 = 3 z M = z A + z C 1 2 ⇒ z A = 2 · z M - z C 1 = 2 · (- 4) - 0 = - 8

Ответ: координаты точки А (7 , 3 , - 8) .

Если вы заметили ошибку в тексте, пожалуйста, выделите её и нажмите Ctrl+Enter

Постановка задачи

Рассмотрим задачу нелинейной оптимизации. Пусть есть функции

При условиях .

Вильям Каруш в своей дипломной работе нашёл необходимые условия в общем случае, когда накладываемые условия могут содержать и уравнения, и неравенства. Независимо от него к тем же выводам пришли Гарольд Кун и Альберт Таккер.

Необходимые условия минимума функции

Если при наложенных ограничениях - решение задачи, то найдётся ненулевой вектор множителей Лагранжа такой, что для функции Лагранжа выполняются условия:

Достаточные условия минимума функции

Перечисленные необходимые условия минимума функции в общем случае не являются достаточными. Существует несколько вариантов дополнительных условий, которые делают их достаточными.

Простая формулировка

Если для допустимой точки выполняются условия стационарности, дополняющей нежёсткости и неотрицательности, а также λ 1 > 0 , то .

Более слабые условия

Если для допустимой точки выполняются условия стационарности, дополняющей нежёсткости и неотрицательности, а также (условие Слейтера ), то .


Wikimedia Foundation . 2010 .

Смотреть что такое "Условия Каруша - Куна - Таккера" в других словарях:

    В теории оптимизации условия Каруша Куна Таккера (англ. Karush Kuhn Tucker conditions, KKT) необходимые условия решения задачи нелинейного программирования. Чтобы решение было оптимальным, должны быть выполнены некоторые… … Википедия

    В теории оптимизации условия Каруша Куна Таккера (англ. Karush Kuhn Tucker conditions, KKT) необходимые условия решения задачи нелинейного программирования. Чтобы решение было оптимальным, должны быть выполнены некоторые условия регулярности.… … Википедия

    Вильям Каруш William Karush Дата рождения: 1 марта 1917(1917 03 01) Место рождения: Чикаго, США Дата смерти … Википедия

    У этого термина существуют и другие значения, см. Оптимизация. Оптимизация в математике, информатике и исследовании операций задача нахождения экстремума (минимума или максимума) целевой функции в некоторой области конечномерного векторного … Википедия Википедия

    Метод множителей Лагранжа, метод нахождения условного экстремума функции f(x), где, относительно m ограничений, i меняется от единицы до m. Содержание 1 Описание метода … Википедия

Теоремы Куна-Таккера - родовое название для утверждений, представляющих собой обобще-

ние теоремы Лагранжа на случай задач оптимизации с ограничениями в виде неравенств, т. е. задач

следующего типа:

gj(x) > 0, j = 1, .

M, (?)

x = (x1, . . . , xn) 2 X.

Здесь f: X 7! R - (в соответствие с установившейся терминологией) целевая функция, gr: X 7! R,

r = 1, . . . ,m, - функции ограничений, X _ Rn - открытое множество.

Теорема 196 (Теорема Джона в терминах седловой точки):

Пусть функции f( ), g1( ), . . . , gn( ) вогнуты и?x - решение задачи (?), такое что?x 2 intX.

Тогда существуют множители Лагранжа _j >

X является решением задачи

Мы приведем эти утверждения для случая, когда функции f, gr дифференцируемы (теоремы Ку-

на-Таккера в дифференциальной форме).

Напомним, что функция

L(x,_) = _0f(x) +

называется функцией Лагранжа (лагранжианом) этой задачи, а коэффициенты _j - множителями

Лагранжа.

Имеет место следующее утверждение.

Теорема 197 (Теорема Джона для дифференцируемых функций):

Пусть?x - решение задачи (?), такое что?x 2 intX и функции f( ), g1( ), . . . , gn( ) дифферен-

цируемы в точке?x.

Тогда существуют множители Лагранжа _j > 0, j = 0, . . . ,m, не все равные нулю, такие что

выполнены следующие соотношения (условия Куна-Таккера):

0, i = 1, . . . , n

J = 0 (условия дополняющей

нежесткости).

Отметим, что условия дополняющей нежесткости можно записать в виде

gj(?x)_j = 0, j = 1, . . . , m.

Из этих условий следует, что если множитель Лагранжа положителен (_j > 0), то соответствующее

ограничение в решении задачи (при x = ?x) выполняется как равенство (т. е. gj(?x) = 0). Другими

словами, это ограничение активно. С другой стороны, в случае, когда gj(?x) > 0, то соответствующий

множитель Лагранжа _j равен нулю.

Если в задаче (?) часть ограничений имеет вид ограничений на неотрицательность некоторых xi ,

то для них можно не вводить множители Лагранжа, записав такие ограничения отдельно:

gj(x) > 0, j = 1, . . . , m, (??)

xi > 0, i 2 P _ {1, . . . , n}. Во внутренней точке (в том смысле, что1 ?x 2 intX) условия первого порядка для i 2 P тогда

будут иметь следующий вид:

Для i /2 P здесь, как и в случае представления задачи в виде (?), производная функции Лагранжа

по той переменной будет иметь вид @L(?x,_)

Кроме того, выполнены также условия дополняющей нежесткости

Из второго из этих условий следует, что при?xi > 0 (i 2 P) выполнено

С другой стороны, если @L(?x,_)/@xi Другая модификация теоремы связана с наличием в задаче ограничений в виде равенств. Обозна-

чим множество соответствующих индексов через E. Задача принимает следующий вид:

gj(x) > 0, j 2 {1, . . . ,m}\E,

gj(x) = 0, j 2 E, (???)

xi > 0, i 2 P _ {1, . . . , n}.

При этом в теореме Джона снимается условие, что все множители Лагранжа неотрицательны -

множители Лагранжа _j при j 2 E могут иметь произвольный знак.

Теорема Джона не гарантирует, что множитель Лагранжа целевой функции, _0 , отличен от нуля.

Однако если _0 = 0, то условия Куна-Таккера характеризуют не решение рассматриваемой задачи, а

структуру множества ограничений в точке?x и теорема не имеет непосредственной связи с интересую-

щей нас задачей максимизации функции f( ), поскольку градиент самой функции f( ) .пропадает. из

условий Куна-Таккера.

Поэтому важно охарактеризовать условия, которые гарантируют, что _0 > 0.

Такие условия называются условиями регулярности.

В случае, когда рассматриваемая задача является выпуклой, одно из условий регулярности, -

так называемое условие Слейтера - имеет вид:

В случае, когда целевая функция и ограничения задачи являются дифференцируемыми, простей-

шее условие регулярности формулируется в терминах градиентов функций-ограничений и имеет вид:

градиенты активных ограничений в точке?x линейно независимы. (В число рассматриваемых ограни-

чений следует включать и ограничения на неотрицательность.)

Обозначим через A множество индексов тех ограничений, которые в точке оптимума?x активны

(в том числе, индексы всех ограничений в виде равенств), т. е.

gj(?x) = 0 , j 2 A.

Тогда если градиенты ограничений - векторы

линейно независимы2, то _0 > 0. Это условие называется условием регулярности Куна-Таккера.

Заметим, что если _0 > 0, то без потери общности можно считать _0 = 1, что обычно и делается.

Соответствующую теорему и называют собственно (прямой) теоремой Куна-Таккера. Теорема 198 (Прямая теорема Куна-Таккера, необходимое условие оптимальности):

Пусть функции f( ), g1( ), . . . , gn( ) дифференцируемы, и?x - решение задачи (?), такое что

X 2 intX и выполнено условие регулярности Куна-Таккера.

Тогда существуют множители Лагранжа _j > 0, j = 1, . . . ,m, такие что при _0 = 1 выполнены

следующие соотношения:

0, i = 1, . . . , n

Несложно переформулировать эту теорему для задач (??) и (???). Здесь требуются такие же мо-

дификации условий Куна-Таккера, как и в теореме Джона.

0, i = 1, . . . , n

можно переписать в виде:

Это соотношение показывает, что в точке оптимума градиент целевой функции является линейной ком-

бинацией антиградиентов ограничений, причем все коэффициенты этой линейной комбинации неотри-

цательны. Рис. 17.1 иллюстрирует это свойство. Интуитивно, идея этого свойства состоит в том, что

если бы какой-нибудь коэффициент линейной комбинации был отрицательным, то можно было бы

увеличить значение целевой функции, двигаясь вдоль этого ограничения. Один из вариантов обратной теорема Куна-Таккера утверждает, что при вогнутости функций

f( ), {gk( )} выполнение этих условий в допустимом решении?x (т. е. точке, удовлетворяющей огра-

ничениям) при некоторых множителях Лагранжа, удовлетворяющих требованиям прямой теоремы,

гарантирует, что?x является решением задачи.

Теорема 199 (Обратная теорема Куна-Таккера /достаточное условие оптимальности/):

Пусть f( ) - дифференцируемая вогнутая функция, g1( ), . . . , gn( ) - дифференцируемые

квазивогнутые функции, множество X выпукло и точка?x допустима в задаче (?), причем?x 2

Пусть, кроме того, существуют множители Лагранжа _j > 0, j = 1, . . . ,m, такие что при

0 = 1 выполнены следующие соотношения:

0, i = 1, . . . , n

Тогда?x - решение задачи (?).

Теорему можно очевидным образом переформулировать для задач (??) и (???). Для задачи (???)

ограничения в виде равенств могут быть только линейными (это связано с тем, что ограничение в виде

равенства, gj(x) = 0, следует представить с помощью двух ограничений в виде неравенств, gj(x) > 0

и?gj(x) > 0, каждое из которых задается квазивогнутой функцией; такое может быть только если

ограничение линейное).

В еще одном варианте достаточного условия оптимальности предположение о вогнутости целевой

функции заменяется на предположение о квазивогнутости с добавлением условия rf(?x) 6= 0.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: