РефератыМатематикаМеМетоды решения некорректно поставленных задач

Методы решения некорректно поставленных задач

ВВЕДЕНИЕ


Среди математических задач выделяется класс задач, решения которых неустойчивы к малым изменениям исходных данных. Они характеризуются тем, что сколь угодно малые изменения исходных данных могут приводить к произвольно большим изменениям решений. Задачи подобного типа, по существу, являются плохо поставленными. Они принадлежат к классу некорректно поставленных задач.


Быстро растущее использование вычислительной техники требует развития вычислительных алгоритмов для решения широких классов задач. Но что надо понимать под «решением» задачи? Каким требованиям должны удовлетворять алгоритмы нахождения « решений »?


Классические концепции и постановки задач не отражают многих особенностей встречающихся на практике задач. Мы покажем это на примере.


Рассмотрим систему линейных алгебраических уравнений


Az=u
,


где z — искомый вектор, и —
известный вектор, А
={aij
} — квадратная матрица с элементами a
ij
.


Если система невырожденная, т. е.detA
¹0, то она имеет единственное решение, которое можно найти по известным формулам Крамера или другими способами.


Если система вырожденная, то она имеет решение (притом не единственное) лишь при выполнении условий разрешимости, состоящих из равенств нулю со- ответствующих определителей.


Таким образом, прежде чем решить систему, надо проверить, вырожденная она или нет. Для этого требуется вычислить определитель системыdetA.


Если п —
порядок системы, то для вычисления detА
требуется выполнить около п
3
операций. С какой бы точностью мы ни производили вычисления, при достаточно большом значении п,
вследствие накопления ошибок вычисления, мы можем получить значение detА,
как угодно отличающееся от истинного. Поэтому желательно иметь (построить) такие алгоритмы нахождения решения системы, которые не требуют предварительного выяснения вырожденности или невырожденности системы.


Кроме того, в практических задачах часто правая часть u
и элементы матрицы А,


т.
е. коэффициенты системы уравнений, известны нам приближенно. В этих случаях вместо системы, мы имеем дело с некоторой другой системойA1
z=u1
такой, что


||А
1
— А
||<=h
, ||u1
-u||<=
d, где смысл норм обычно определяется характером задачи. Имея вместо матрицы А
матрицу А
1
,
мы тем более не можем высказать определенного суждения овырожденности или невырожденности системы.


В этих случаях о точной системе Az
= и
нам известно лишь то, что для матрицы А
и правой части и
выполняются неравенства ||А1
—А
||<= h
и ||и
1
—и
||
<
=
d. Но систем с такими исходными данными (А, и)
бесконечно много, и в рамках известного нам уровня погрешности они неразличимы. Среди таких «возможных точных систем» могут быть и вырожденные.


Поскольку вместо точной системы мы имеем приближенную систему A
1
z

1
,
то речь может идти лишь о нахождении приближенного решения. Но приближенная система может быть и неразрешимой. Возникает вопрос: что надо понимать под приближенным решением системы? Оно должно быть также устойчивым к малым изменениям исходных данных (А, и).


В данной работе будет введено понятие приближенного решения некорректно поставленных задач, а также будет рассмотрено несколько методов нахождения таких решений.


1. ПОНЯТИЕ КОРРЕКТНО ПОСТАВЛЕННЫХ И НЕКОРРЕКТНО ПОСТАВЛЕННЫХ ЗАДАЧ


1.1.
Различают корректно поставленные, и некорректно поставленные задачи. Понятие корректной постановки задач математической физики было введено


Ж. Адамаром в связи с желанием выяснить, какие типы граничных условий наиболее естественны для различных типов дифференциальных уравнений (для эллиптических, например,— задача Дирихле и ей аналогичные, для гиперболических — задача Коши).


Решение всякой количественной задачи обычно заключается в нахождении «решения» z по заданным «исходным данным» и,
z=R(u).
Мы будем считать их эле- ментами метрических пространствF
иU
с
расстояниями между элементами; u1
, u2
ÎU; z1
,z2
ÎF.
Метрика обычно определяется постановкой задачи.


1.
2.
Пусть определено понятие «решения» и каждому элементу и
ÎU отвечает единственное решениеz=R(u)
из пространстваF.


Задача определения решенияz=R(u)
из простран­ства F
по исходным данным


и
ÎU
называется устойчивой
на пространствах (F, U),
если для любого числа e> О
можно указать такое число d (e) >
0, что из неравенства rU
(u1
,u2
)<= d (e) следуетrF
(z1,
z2
)<= e, гдеz1
=R(u1
),
z2
=R(u
2
)
; u1
,u2
ÎU; z1
,z2
ÎF.


Задача определения решенияz
из пространства F
по «исходным данным» и
из пространства U
называется корректно поставленной на паре метрических прост­ранств
(F,
U),
если удовлетворяются требования (усло­вия):


1) для всякого элемента и
ÎU
существует решение z из пространства F,


2) решение определяется однозначно;


3) задача устойчива на пространствах (F, U).
В математической литературе длительное время су­ществовала точка зрения, согласно которой всякая ма­тематическая задача должна удовлетворять этим требо­ваниям .


Задачи, не удовлетворяющие перечисленным требова­ниям, называются некорректно поставленными.


Следует отметить, что определение некорректно по­ставленных задач относится кданной паре метри­ческих пространств (F, U),
так как в других метриках та же задача может быть корректно поставленной .


1.3
.
Задача нахождения приближенного решения не­корректно поставленной задачи вида


Az
= и, и
ÎU,
(1; 3,1)


в естественном классе элементов F
является практически недоопределенной.Эта задача является некорректно поставленной, например, в случаях, когда А —
вполне непрерывный оператор. Тогда обрат­ный ему оператор A-1
вообще говоря, не будет непрерывным на U и решение уравнения (1; 3,1) не будет устойчивым к малым изменениям правой части и
(в метрике пространстваU).
Исход­ными данными здесь являются правая часть уравнения u и оператор А.


Предположим, что оператор А
нам известен точно, а правая часть уравнения (1; 3,1) известна с точностью d, т. е. вместо ее точного значения uT
нам известны элемент и
1
и число d такие, что rU
(uT
,u1
)<= d. По этим данным, т. е. по (u1
, d), требуется найти такой элемент zd
, ко­торый стремился бы (в метрике F)
кzT
при d®0.
Та­кой элемент мы будем называть приближенным
(к zT
) решением
уравнения Az = и
1
.


Элементы zÎF,
удовлетворяющие условию rU
(Az, и
1
)
<=
d, будем называть сопоставимыми по точности с
ис­ходными данными (и
1
,
d). Пусть Qd
—совокупность всех таких элементов z ÎF.
Естественно приближенные ре­шения уравнения Az=и
1
искать в классе Qd
элементов z
,
сопоставимых по точности с исходными данными



1
,
d ).


Однако в ряде случаев этот класс элементов слишком широк. Среди этих элементов есть такие, которые могут сильно отличаться друг от друга ( в метрике пространства F ). Поэтому не все элементы класса Qd
можно брать в качестве приближенного решения уравнения (1;3,1).


2.
МЕТОД ПОДБОРА. КВАЗИРЕШЕНИЯ


Возможность определения приближенных решений некорректно поставленных задач, устойчивых к малым изменениям исходных данных, основывается на исполь­зовании дополнительной информации относительно реше­ния. Возможны различные типы дополнительной инфор­мации.


В первой категории случаев дополнительная инфор­мация, носящая количественный характер, позволяет сузить класс возможных решений, например, до ком­пактного множества, и задача становится устойчивой к малым изменениям исходных данных. Во второй катего­рии случаев для нахождения приближенных решений, устойчивых к малым изменениям исходных данных, ис­пользуется лишь качественная информация о решения (например, информация о характере его гладкости).


В настоящей главе будет рассмотрен метод подбора, имеющий широкое практическое применение, метод квазирешения, а также метод замены исходного уравне­ния близким ему и метод квазиобращения. В качестве некорректно поставленной задачи мы будем рассматри­вать задачу решения уравнения


Az=u
(2; 0,1)


относительноz,
гдеu
ÎU, z
ÎF, U
и F—метрические пространства. Оператор А
отображаетF
на U.
Предпо­лагается, что существует обратный оператор А
-1
,
но он не является, вообще говоря, непрерывным.


Уравнение (2; 0,1) с оператором А,
обладающим ука­занными свойствами, будем называть операторным урав­нением первого рода,
или, короче,— уравнением пер­вого рода.


2.1. Метод подбора решения некорректно поставленных задач


2.1.1. Широко распространенным в вычислительной практике способом приближенного решения уравнения (2;0,1) является метод подбора. Он состоит в том, что для элементов z некоторого заранее заданного подклас­са возможных решений М (М
ÎF)
вычисляется опера­торAz,
т. е. решается прямая задача. В качестве при­ближенного решения берется такой элемент z0
из мно­жества М,
на котором невязкаrU
(Az,u
)
достигает мини­мума, т. е.


rU
(Az0
,u
)
=
inf rU
(Az,u
)


zÎM


Пусть правая часть уравнения (2;0,1) известна точ­но, т. е. и
=uT
, и требуется найти его решение zT
. Обычно в качестве М
берется множество элементов z, зависящих от конечного числа параметров, меняющихся в ограниченных пределах так, чтобы М
было замкнутым множеством конечномерного пространства. Если искомое точное решение zT
уравнения (2; 0,1) принадлежит мно­жеству М,
то и достигается эта нижняя граница на точном решении zT
. Если уравнение (2;0,1) имеет единственное решение, то элемент z0
, минимизирующий rU
(Az,и),
определен однозначно.


Практически минимизация невязки rU
(Az,и
)
произ­водится приближенно и возникает следующий важный вопрос об эффективности метода подбора, т. е. о возмож­ности как угодно приблизиться к искомому точному ре­шению.


Пусть {zn
} — последовательность элементов, для ко­торой rU
(Azn
,u) ®0 при n®¥. При каких условиях можно утверждать, что при этом и rF
(zn
,zT
) ®0, т. е. что {zn
} сходится к zT
?


Это вопрос обоснования эффективности метода подбора.


2.1.2. Стремление обосновать успешность метода подбора привело к установлению общефункциональных требова­ний, ограничивающих класс возможных решений М,
при которых метод подбора является устойчивым и zn
®zT
. Эти требования заключаются в компактности мно­жества М
и основываются на приводимой ниже извест­ной топологической лемме.


Лемма.Пусть метрическое пространство F отобра­жается на метрическое пространство U и Uo — образ мно­жества Fo, FoÌF, при этом отображении. Если отобра­жение F®U непрерывно, взаимно однозначно и множест­во Fo компактно на F, то обратное отображение Uo®Fo множества Uoна множество Fo также непрерывно по мет­рике пространства F.


Доказательство.
Пусть z — элементы множества F (zÎF), а u—элементы множества U (uÎU). Пусть функция u=j(z) осуществляет прямое отображение F®U, а функция z=y(u)—обратное отображение U®F.


Возьмем произвольный элемент u0
из Uo.
Покажем, что функция y(u)
непрерывна на u0
. Предположим, что это неверно. Тогда существует такое число e1
> 0, что для всякого d > 0 найдется элемент и
1
из Uo,
для которого rU

1
, и
0
)
<
d, в то время как rF
(z1
,z0
)>=
e1
. Здесь z=y(u1
), z0
=y(u0
) и z1
ÎFo, z0
ÎF0
.


Возьмем последовательность {dn
} положительных чи­сел dn
, сходящуюся к нулю при п
®¥.
Для каждого dn
найдется элемент un
1
из Uo,
для которого rU

n
1
, и
0
)
<
dn
, но rF
(zn
1
,z0
)>=
e1
, где zn
1
=y(un
1
). Очевидно, последова­тельность {un
1
} сходится к элементу u0
.
Так как zn
1
при­надлежат компактному на F
множеству Fo, то из после­довательности {zn
1
} можно выбрать подпоследовательность {Z1
nk
}, сходящуюся по метрике F
к
некоторому элементу z0
ÎF.
При этом z0
1
¹z0
, так как для всякого nk
rF
(Z1
nk
,z0
)>= e1
, следовательно и rF
(z1
0
,z0
)>= e1
.
Этой подпоследовательности {Z1
nk
} отвечает последователь­ность элементов u1
nk
= j (Z1
nk
) из Uo,
сходящаяся к u1
0
= j(z1
0
) и являющаяся подпоследовательностью по­следовательности {
u1
n
}.
Так как последовательность {
u1
n
}
сходится к и
0
=j(z0
), то u1
0
=j(z1
0
)=u0
=j(z0
) , т. е. j(z0
)= j(z1
0
). В силу взаимной однозначности отоб­ражения F
®U z1
0
=z0
, что противоречит ранее установ­ленному неравенству z1
0
¹z0
. Лемма доказана.


Эту лемму можно сформулировать короче.


Если отображение Fo-Uo компакта Fo на множество Uo взаимно однозначно и непрерывно, то обратное отобра­жение Uo-Fo также непрерывно.


Эквивалентность этих формулировок следует из того, что замыкание F*
0
множества Fo,
компактного наF,
явля­ется компактом.


Таким образом, минимизирующая последовательность {zn
} в методе подбора сходится к zT
при n-¥, если:


а)zT
принадлежит классу возможных решений М;


б) множество М —
компакт.


Пусть оператор А
непрерывен и вместо точной правой части uT
мы имеем элемент ud
такой, что rU
(ud
,uT
)<= d, причем ud
принадлежит множествуAM
(образу множест­ва М
при отображении его с помощью оператора A) и М
есть компакт. Пусть {dn
} — последовательность поло­жительных чисел таких, что dn
-0 при n-оо. Для каж­дого п
методом подбора можно найти такой элемент zd
n
, что rU
(A zd
n
,ud
)<=dn
. Элементы zd
n
будут близки к ре­шению zT
уравненияAz=uT
. В самом деле, при отобра­жении с помощью непрерывного оператора образAM
компакта М
есть компакт и, следовательно, по лемме обратное отображение, осуществляемое оператором A-1
, непрерывно наAM.
Так как


rU
(A zd
n
,u)<=rU
(A zn
,ud
)+rU
(ud
,uT
),


то


rU
(A zd
n
,uT
)<=dn
+d=gd
n
.


Из этого неравенства и из непрерывности обратного отображения АМ
- М
следует, что rF
(zd
n
,zT
)<= e(gd
n
) , причем e(gd
n
)-0 приgd
n
-0. Таким образом, при нахож­дении приближения zd
n
к zT
надо учитывать уровень по­грешности d правой части ud
.


2.1.3. На основе изложенных соображений М. М. Лав­рентьев сформулировал понятие корректности по Тихонову.
В применении к уравнению (2; 0,1) задача на­зывается корректной по Тихонову,
если известно, что для точного значения u=uT
существует единственное реше­ние zT
уравнения (2; 0,1), AzT
=uT,
принадлежащее за­данному компакту М.
В этом случае оператор А
-1
непре­рывен на множествеN=AM
и, если вместо элемента uT
нам известен элемент ud
такой, что rU
( uT
, ud
)<=dи ud
ÎN,
то в качестве приближенного решения уравнения (2; 0,1) с правой частью u= ud
можно взять элемент zd
=A-1
ud
.При d-0(ud
ÎN) zd
будет стремиться к zT
. МножествоF1
(F1
ÌF),
на котором задача нахождения решения уравнения (2; 0,1) является корректно постав­ленной, называют классом корректности.
Так, если опера­торА
непрерывен и осуществляет взаимно однозначное отображение, то компакт М, к
которому принадлежит zT
, является классом корректности для уравнения (2; 0,1). Таким образом, если задача (2; 0,1) корректна по Тихо­нову и правая часть уравнения uÎAM,
то метод подбора с успехом может быть применен к решению такой задачи. На первый вопрос дан исчерпывающий ответ.


Рассмотрим задачу решения интегрального уравнения Фредгольма первого рода


(2;1,1)


на множестве М
1
монотонно убывающих (возрастающих) и равномерно ограниченных функций |z(s)|<=B. Она корректна по Тихонову, так как множествоM1

компакт в пространстве L2
.


Действительно, возьмем любую последовательность E=
{z1
(s), z2
(s), .... zn
(s), ...} изM1
.
Согласно теореме Хелли о выборе существуют подпоследовательность


E1
= {Zn1
(s), Zn2
(s), ...,Znk
(s), ...},


последовательности Е
и функция z*(s) из множества M1
, z*(s) ÎL2
, такие, что



всюду, кроме, может быть, счетного множества точек разрыва функции z*(s). Из поточечной сходимости под­последовательности Е
1
к функции z*(s) всюду, кроме, может быть, счетного множества точек, следует, какизвестно, сходимость подпоследовательности E1
к функ­ции z*(s) по метрике L2
.


Таким образом, в качестве приближенного решения на множестве М1
уравнения (2; 1,1) с приближенно извест­ной правой частью u1
ÎАМ
1
можно брать точное решение этого уравнения с правой частью u=u1
.
Эта послед­няя задача эквивалентна задаче нахожде­ния на множествеM1
функции, минимизирующей функ­ционал


N[z,u1
]=|| A1
z – u1
||2
L2
.


Пусть rU
(uT
, u1
)<= d. Тогда, очевидно, в качестве при­ближенного решения уравнения (2; 1,1) можно брать функцию zd
, для которой


|| A1
zd
– u1
||2
L2
<= d2
. (2;1,2)


Если заменить интегральный оператор A1
z интеграль­ной суммой на фиксированной сетке с n узлами и обозна­чить значения искомой функции в узловых точках через zi
, то задача построения приближенного решения уравне­ния (2; 1,1) сведется к задаче нахождения конечномер­ного вектора, минимизирующего функционалN[z,
и
1
]
и удовлетворяющего неравенству (2; 1,2).


В ряде других случаев компактные классы коррект­ности можно указать эффективно, что дает возможность строить устойчивые приближенные решения.


2.1.4. В силу погрешности исходных данных элемент и
может не принадлежать множествуAM.
В этих условиях уравнение (2; 0,1) не имеет решения (классического) и возникает вопрос: что надо понимать под приближенным решением уравнения (2; 0,1)?


В этом случае вводится понятие квазирешения и метод подбора при условии компактности множества М
позво­ляет найти приближение к квазирешению. В следующемпараграфе вопрос о квазирешении рассматривается под­робнее.


2.2.
Квазирешения


2.2.1. Пусть оператор А
в уравнении (2; 0,1) — вполне непрерывный. Построение устойчивого к малым измене­ниям правой части и
приближенного решения уравнения (2; 0,1) по формуле


z=A-1
u (2; 2,1)


возможно в тех случаях, как отмечалось в 2.1. , когда ре­шение ищется на компакте М
ÌF
и правая часть уравне­ния принадлежит множеству N
=AM.


Обычно не существует эффективных критериев, поз­воляющих установить принадлежность элемента и
множеству N.
Это приходится предполагать известным априори. В практических задачах часто вместо точного значения правой части и
T
нам известно ее приближенное значение u1
, которое может не принадлежать множеству N
=AM.
В этих случаях нельзя строить приближенное решение уравнения (2; 0,1) по формуле (2; 2,1), так как сим­вол А-1
u может не иметь смысла.


2.2.2. Стремление устранить затруднения, связанные с от­сутствием решения уравнения (2; 0,1) при неточной правой части, привело В. К. Иванова к понятию квазирешения уравнения (2; 0,1) — обобщению понятия решения этого уравнения.


Элемент z1
ÎМ,
минимизирующий при данном и
функ­ционалrU
(Az1
,и)
на множестве М,
называется квазиреше­нием
уравнения (2; 0,1) на М,



Если М —
компакт, то квазирешение, очевидно, существу­ет для любого и
ÎU
и если, кроме того, и
ÎAM,
то ква­зирешение z1
совпадает с обычным (точным) решением уравнения (2; 0,1). Квазирешение может быть и не одно. В этом случае под квазирешенпем будем разуметь любой элемент из множества квазирешенийD.


Можно указать достаточные условия, при которых квазирешение единственно и непрерывно зависит от пра­вой части и.


Напомним определение. Пусть элемент у
и множество Q
принадлежат пространству U.
Элементq
множестваQ
называется проекцией
элемента у
на множество Q, q
=Ру,
если выполняется равенство




где


Теорема 1.
Если уравнение Аz=
u может иметь на компакте М не болееодного решения и проекция каждого элемента uÎU на множество N =
AM единственна, то квазирешение уравнения (2; 0,1)
единственно и непре­рывно зависит от правой части u.


Доказательство. Пусть z1
— квазирешение и и
1

z1
.
Очевидно, и
1
есть проекция элемента u на множе­ство N
=AM.
По условию теоремы она определяется од­нозначно. Отсюда, в силу взаимной однозначности ото­бражения множества М
на множествоN,
следует един­ственность квазирешения z1
.


Очевидно, что z1
= А-1
u=А
-1
Ри.
Согласно лемме о непрерывности обратного отображения компакта (см. предыдущий параграф) оператор А-1
непрерывен на N.
Оператор проектирования Р непрерывен на U.
Поэтому А-1
P
— непрерывный на U
оператор и, следовательно, квазирешение z1
непрерывно зависит от правой части и.


Таким образом, при переходе к квазирешению восста­навливаются все условия корректности, т. е. задача на­хождения квазирешения уравнения (2; 0,1) на компакте М
является корректно поставленной.


Если условие единственности решения уравнения (2; 0,1) не выполнено, то квазирешения образуют некото­рое множествоD
элементов компакта М.
В этом случае без упомянутых в теореме 1 ограничений на множество N
имеет место непрерывная зависимость множества квази­решений D
от и
в смысле непрерывности многозначных отображений. Для случая, когда уравнение (2; 0,1) линейно, легко получить более общие результаты, содержащиеся в сле­дующей теореме .


Теорема 2.Пусть уравнение
(2; 0,1) линейно, одно­родное уравнение
Az=0имеет только нулевое решение, множество М выпукло, а всякая сфера в пространстве U строго выпукла. Тогда квазирешение уравнения
(2; 0,1) на компакте М единственно и непрерывно зависит от пра­вой части и.


Доказательство. Пусть z1
— квазирешение и u1
=Az1
.
Так как множество М
выпукло, то в силу линей­ности оператора А
множество N
=AM
также выпукло. Очевидно, что и
1
есть проекция элемента и
на множество N.
В силу того, что сфера в пространстве U
по условию теоремы строго выпукла, проекция и
определяется одно­значно. Далее доказательство завершается, как в тео­реме 1.


2.2.3. ПустьF
и U —
гильбертовы пространства, М
ÎSR

шар (|| z ||<=R ) в пространстве F
и А —
вполне непре­рывный линейный оператор.


В этом случае квазирешение уравнения (2; 0,1) мож­но представить в виде ряда по собственным элементам (функциям, векторам) jn
оператора А*А,
где А* —
опе­ратор, сопряженный оператору А.


Известно, что А*А —
самосопряженный положитель­ный вполне непрерывный оператор из F
в F.
Пусть l1
>=l2
>=…>=ln
>=… — полная система его собственных значений, a j1
, j2
,…, jn
,…—отвечающая им полная ортонормированная система его собственных элементов (функций, векторов). Элемент А*и
можно представить в виде ряда


(2;2,2)


В этих условиях справедлива


Теорема 3.
Квазирешение уравнения (2, 0,1)
намножествеSR
выражается формулами:


(2;2,3)


если


(2;2,4)


и



если


(2;2,5)


Здесьb —корень уравнения


(2;2,6)


Доказательство. Квазирсшение минимизирует функционал


rU
2
(Az,u) == (Az —u, Az — u) (2;2,7)


(где (v,w
) —
скалярное произведение элементовv
иw
из U),
уравнение Эйлера для которого имеет вид


A*Az=A*u. (2;2,8)


Решение этого уравнения будем искать в виде ряда по системе {jn
}:


(2;2,9)


Подставляя этот ряд в уравнение (2; 2,8) и используя разложение (2;2,2), находим сn
=bn
/
ln
. Следователь­но, неравенство (2; 2,4) означает, что ||z||<R и речь идет о нахождении безусловного экстремума функциона­ла (2; 2,7). Ряд (2; 2,3) и будет решением задачи.


Если же выполняется неравенство (2; 2,5), то это означает, что ||z||>=R и надо решать задачу на услов­ные экстремум функционала (2; 2,7) при условии, что || z ||2
=R2
.
Методом неопределенных множителей Лагранжа эта задача сводится к нахождению безусловного экстремума функционала


(Аz-u, Аz-u) +b (z, z),


а последняя — к решению отвечающего ему уравнения ЭйлераA*Az
+bz=А*и.
Подставляя сюда z в виде ряда (2; 2,9) и используя разложение (2; 2,2), находим



Параметр b определяем из условия || z ||2
=R2
, которое эквивалентно (2; 2,6).


2.3.
Приближенное нахождение квазирешений


В предыдущем параграфемы видели, что нахождение квазирешения связано с нахождением элемента в беско­нечномерном пространстве. Для приближенного нахожде­ния квазирешения естественно переходить к конечномер­ному пространству. Можно указать достаточно общий под­ход к приближенному нахождению квазирешений урав­нения (2; 0,1) , в котором А—вполне непре­рывный оператор.


Будем полагать, что выполнены указанные в 2.2. дос­таточные условия существования единственного квазире­шения на заданном множестве М,
т. е. полагаем, что множество М —
выпуклый компакт и сфера в пространст­ве U
строго выпукла. Пусть


M1
Ì M2
Ì...Ì Mn
Ì...


— возрастающая цепочка компактных замкнутых множеств М
n
такая, что замыкание их объединения совпадает с М.
Квазирешение уравнения (2; 0,1) сущест­вует на каждом множестве М
n
.
Но оно может быть не единственным. Обозначим через Т
n
совокупность всех квазирешений на множестве М
n
.


Покажем, что в качестве приближения к квазиреше­нию z1
на множестве М
можно брать любой элемент z1
n
из Т
n
.
При этом



Пусть Nn
=
АМ
n
и В
n

множество проекций элемен­та и
на множествоNn
.
Очевидно, что В
n
=АТ
n
и N1
Í N2
Í …Í Nn
;
тогда


rU
(u,N1
)>= …>=rU
(u,Nn
)>=… rU
(u,N)= rU
(u,Az1
) .(2;3,1)


Так как множествовсюду плотно на N,
тодлявсякого e >0 найдется такое число n0
(e), что для всех п
>
n0
(e)


rU
(u,Nn
)<rU
(u,N)+e (2; 3,2)


Из (2; 3,1) и (2; 3,2) следует, что


(2;3,3)




Поскольку


то









(2;3,4)


Каждое множествоВ

n

есть компакт, так как оно является замкнутым подмножеством компактаNn
.
ПоэтомувВ

n

найдется такой элемент уn
, что


rU
(yn
,u) = inf rU
(y,u)


yÎBn


Последовательность {yn
} имеет хотя бы одну пре­дельную точку, принадлежащуюN,
так как N —
компакт. Пусть у
0

какая-нибудь предельная точка множества {yn
} и {уnk
} — подпоследовательность, сходящаяся к y0
,
т. е.



Из (2; 3,3) и (2; 3,4) следует, что



Таким образом,


rU
(u,y0
)=rU
(u,N).


Отсюда и из единственности квазирешения на множестве М
следует, что


y0
=Az1
.


Так как у
0

произвольная предельная точка множества {yn
}, то последовательность {уn
} сходится к А
z1
. Это и означает,что в качестве приближения к квазирешению мож­но брать любой элемент z1
n
из множества Тп
,
так как в силу леммы параграфа 2.1. z1
n
-z* при n-¥.


Если в качестве Мп
брать конечномерные (n-мерные) множества, то задача нахождения приближенного квази­решения на компакте М
сводится к минимизации функ­ционалаrU
(Az,u) на множестве Мп
,
т. е. к нахождению минимума функции п
переменных.


2.4.
Замена уравнения А
z
=
u
близким ему


Уравнения вида (2; 0,1), в которых правая часть u не принадлежит множествуN=AM,
изучались М. М. Лав­рентьевым . Ему принадлежит идея замены исходного уравнения (2; 0,1) близким ему, в некотором смысле, уравнением, для которого задача нахождения решения устойчива к малым изменениям правой части и разрешима для любой правой части u ÎU.
В простей­шем случае это делается следующим образом.


ПустьF
ºU
ºН —
гильбертовы пространства, А —
линейный, ограниченный, положительный и самосопря­женный оператор,SR
º {х, ||x||<=R,xÎF} есть шар радиуса R в пространстве F,
В —
вполне непрерывный оператор, определенный на SR
при любом R > 0. В ка­честве класса корректности М
берется множество DR
=BSR

образ шара SR
при отображении с помощью оператора В.
Предполагается, что искомое точное решение zT
уравнения (2; 0,1) с правой частью u=uT
существует и принадлежит множеству DR
. Уравнение (2; 0,1) заме­няется уравнением


(A+aE)z º Az+az=u ,
(2:4,1)


где a>0 – числовой параметр. Решение уравнения


za
=(A+aE)-1
u , (2; 4,2)


при соответствующем выборе параметра a, принимается за приближенное решение уравнения (2; 0,1). Здесь Е —
единичный оператор.


Замечание. Для оценки уклонения rF
(zT
,zd
) приближенного решения от точного можно использовать мо­дуль непрерывности w обратного оператора на N.


Пусть u1
, u2
Î N иrU
(u1
,u2
)<=d. Тогда


w(d,N)= sup rF
(A-1
u1
,A-1
u2
).


u1
,u2
ÎN


Очевидно, что еслиrU
(uT
,ud
)<=dи zd
=A-1
ud
, то


rF
(zT
,zd
)<=w(d,N).


Вернемся к уравнению (2; 4,1). Если || Az ||<=d и w(d,DR
) = sup|| z ||, то легко


DR


получить оценку уклонения za
от zT
. Очевидно, что


|| za
- zT
||<=||za
1
- zT
|| + ||za
- za
1
||, (2;4,3)


где


za
1
=(A + aE)-1
uT
.


Следовательно,


||za
- zT
||<=w(d,DR
) + d/a. (2;4,4)


Если известен модуль непрерывности w(d,DR
) или его мажоранта, то из (2; 4,4) можно найти значение пара­метра wкак функцию d, при котором правая часть в не­равенстве (2; 4,4) будет минимальной.


2. 5.
Метод квазиобращения


2.5.1. Известно, что задача Коши для уравнения тепло­проводности с обратным течением времени является не­устойчивой к малым изменениям начальных значений. Неустойчивость сохраняется и в случаях, когда решение подчиняется некоторым дополнительным граничным усло­виям. Для устойчивого решения таких задач разработан метод квазиобращения . Мы изложим существо его для простейшего уравнения теплопроводности, не вда­ваясь в вопросы обоснования. Подробное изложение в применении к более широкому классу задач содержится в .


2.5.2. Рассмотрим прямую задачу. ПустьD

конечная область n-мерного евклидова пространства Rn
точек x = (x1
,x2
, ...,
xn
),
ограниченная кусочно-гладкой по­верхностью S, a t —
время. Пусть, далее, j(x) —
заданнаянепрерывная в D
функция. Прямая задача состоит в на­хождении решения u=
u
(x,t) уравнения


(2;5,1)


в областиG
º{xÎ D, t > 0}, удовлетворяющего гранич­ным условиям


u(х, t) =0 при xÎS(2; 5,2)


и начальным условиям


u
(x,
0)= j(x). (2; 5,3)


Здесь



Известно, что решение такой задачи существует. Каждой функции j(x)ÎC отвечает решение задачи (2; 5,1)— (2; 5,3). Будем обозначать его через u(х, t;
j).


Обратная задача состоит в нахождении функции j(х)по известной функции u(х,t;
j). В реальных задачах функция u(x,t;j) обычно получается в результате изме­рений и, следовательно, известна приближенно. Будем по­лагать, что uÎL2
. Такая функция может и не соответст­вовать никакой «начальной» функции j(х). Таким обра­зом, может не существовать в классе функций С
решения обратной задачи. Поэтому будем рассматривать задачу нахождения некоторого обобщенного решения обратной задачи.


Пусть заданы число T > 0 и функция y(x), опреде­ленная в областиD,

y(x) ÎL2
. На функциях j(х) класса С
определен функционал



Обобщенным решением
обратной задачи будем называть функцию j(х)., на которой достигается


f0
=inf f(j)


jÎC


Замечание. «Естественный» подход к решению этой задачи —

выбрать функцию j(х).так, чтобы f(j)=0 .


Для этого достаточно найти решение прямой задачи



u(x, t) = 0 для х Î S, 0 < t <T;


u(x,T) = y(x)


и положить j (x) = u(x,0). Но такая задача при задан­ной функции y(x) из L2
,
вообще говоря, неразрешима и, кроме того, неустойчива к малым изменениям функ­ции y(x).


На некотором классе обобщенных функций j (x) f0
=0 . Поэтому рассматривается задача на­хождения приближенного значения f0
с заданным уровнем погрешности.


Для заданного числаe > 0найти функциюje
(x), на которойf(je
)<=e.


Эта задача и решается методом квазиобращения.


Идея метода квазиобращения состоит в том, что вмес­то оператора теплопроводности находится «близ­кий» ему оператор В
a
,
для которого задача с обращением отсчета времени


Ba
ua
= 0,xÎD, t <
Т, a > 0;


ua
(x,T)= y(x);


ua
(x,t)= 0 для xÎ
S, t<
Т


устойчива. Решив эту задачу, полагают j (x)=ua
(x,0). Обычно в качестве оператора В
a
берут оператор и решают прямую задачу



D, t<T,
a>0;





ua
(x,T)= y(x);


ua
(x,t)= 0 для xÎ
S, 0< t<=
Т


Dua
=0 для xÎ S, 0< t<= Т.


Затем полагают


j
(x)=u
a
(x,0).


Следует отметить, что u

a
не сходится в обычном смыс­ле при a -0.


3.МЕТОД РЕГУЛЯРИЗАЦИИ РЕШЕНИЯ ОПЕРАТОРНЫХ УРАВНЕНИЙ


В главе предыдущем разделе рассмотрены случаи, когда класс возможных решений уравнения (2; 0,1) является компактом. Однако для ряда прикладных задач характерна ситуация, когда этот классF
не является компактом, и, кроме того, изме­нения правой части уравнения


А
z
= u,
(
3
;
0,1)


связанные с ее приближенным характером, могут выво­дить за пределы множестваAF

образа множества F
при отображении его с помощью оператора А.
Такие задачи называются существенно некорректными.
Был разработан новый подход к решению некорректно поставленных задач, позволяющий строить приближенные решения уравнения (3; 0,1), устойчивые к малым изме­нениям исходных данных, для существенно некорректных задач. В основе этого подхода лежит фундаментальное понятие регуляризирующего оператора (P.O.) . Для упрощения изложения в настоящей главе мы будем полагать, что в уравнении (3; 0,1) приближенной может быть лишь пра­вая часть и,
а оператор А
известен точно.


3.1. Понятие регуляризирующего оператора


3.1.1. Пусть оператор А
в уравнении (3; 0,1) таков, что обратный ему оператор


A-1
не является непрерывным на множестве AF
и множество возможных решений F
не является компактом.


Пусть zT
есть решение уравненияAz
=uT
, т. е. AzT
=
uT
.Часто вместо uT
мы имеем некоторый элемент ud
и известное число d > 0 такие, что rU
(ud
,uT
)<= d, т. е. вместо точных исходных данных (uT
,А)
мы имеем при­ближенные исходные данные (ud
, А)
и оценку их погрешности d. Задача состоит в том, чтобы по известным исход­ным данным (ud
,A, d) найти приближение zd
к элементу zt
,обладающее свойством устойчивости к малым измене­ниям ud
. Очевидно, что в качестве приближенного реше­ния zd
уравнения (3; 0,1) нельзя брать точное решение этого уравнения с приближенной правой частью и
= ud
,
т. е. элемент zT
, определяемый по формуле


zd
=A-1
ud


так как оно существует не для всякого элемента u ÎU ине обладает свойством устойчивости к малым изменениям правой части и.


Числовой параметр d характеризует погрешность пра­вой части уравнения (3;0,1). Поэтому представляется естественным определить zd
с помощью оператора, зави­сящего от параметра, значения которого надо брать согла­сованными с погрешностью d исходных данных ud
.
Эта согласованность должна быть такой, чтобы при d-0, т. е. при приближении (в метрике пространства U
) правой части ud
уравнения (3; 0,1) к точному значению uT
,
при­ближенное решение zd
стремилось бы (в метрике прост­ранстваF)
к искомому точному решениюzt
уравнения AzT
=uT
.


Пусть элементы zT
ÎF
и uT
ÎU
связаны соотношением AzT
= uT
.


Определение 1. Оператор R(и,
d), действующий из пространства U
в пространство F,
называется регуля-ризирующим
для уравнения A
z
= и
(относительно эле­мента uT
),
если он обладает свойствами:


1) существует такое числоd1 > 0, что оператор R(u,
d) определен для всякого d, 0<=d<=d1, и любого ud
ÎU
такого, что


rU
(ud
,uT
)<= d;


2) для всякого e > 0 существует d0=d0(e, ud
)<=d1 такое, что из неравенства


rU
(ud
,uT
)<= d<= d0;


следует неравенство


rF
(zd
,zT
)<= e,


где


zd
=R(ud
,d).


Здесь не предполагается, вообще говоря, однозначность оператораR(u,
d). Через zd
обозначается произвольныйэлемент из множества {R(ud
,d)} значений оператора R(ud
,d).


3.1.2. В ряде случаев целесообразнее пользоваться другим определением регуляризирующего оператора (P.O.).


Определение 2. Оператор R(u, a), зависящий от параметра a и действующий из U
в F,
называется регуляризирующим
для уравнения A
z

(относительно эле­мента uT
), если он обладает свойствами:


1) существуют такие числаd1>0, a1>0, что опера­торR(u,
a)
определен для всякого a, принадлежащего промежутку (0, a1), и любого uÎU,
для которого


rU
(u,uT
)<=d1;


2) существует такой функционал a=a(u, d), опреде­ленный на множестве Ud1
º{u; r(u,uT
)<= d1} эле­ментов и
ÎU,
что для любого e > 0 найдется число d(e)<=d1 такое, что если u1
ÎU и rU
(u1
,uT
)<= d<= d(e), то


rF
(za
,zT
)<= e , где


za
=R(u1
, a(u1
,d)).


В этом определении не предполагается однозначность оператора R(u1
, a(u1
,d)). Следует отметить, что при a=
d получаем определение 1 .


3.1.3. Если rU
(ud
,uT
)<= d, то известно, что в качест­ве приближенного решения уравнения (3; 0,1) с прибли­женно известной правой частью ud
можно брать элемент za
=R(d, a), полученный с помощью регуляризирующе­го оператора R(u, a ), где a=a(ud
)=a1(d) согласовано с погрешностью исходных данных ud
. Это решение назы­вается регуляризованным решением уравнения (3; 0,1). Числовой параметр aназывается параметром регуляриза­ции. Очевидно, что всякий регуляризирующий оператор вместе с выбором параметра регуляризации a, согласо­ванного с погрешностью исходных данных ud
,a=a(ud
), определяет устойчивый к малым изменениям правой час­ти и метод построения приближенных решений уравнения (3;0,1). Если известно, что rU
(ud
,uT
)<= d, то согласно определению регуляризирующего оператора можно так выбрать значение параметра регуляризации a=a(ud
) ,


что при d-0 регуляризованное решение R(ud
,a(ud
)) стремится (в метрике F) к искомому точному ре­шению zT
, т. е.rF
(zT
,za
(u
d
)
). Это и оправдывает пред­ложение брать в качестве приближенного решения урав­нения (3; 0,1) регуляризованное решение.


Таким образом, задача нахождения приближенного решения уравнения (3; 0,1), устойчивого к малым изме­нениям правой части, сводится:


а) к нахождению регуляризирующих операторов;


б) к определению параметра регуляризации aпо до­полнительной информации о задаче, например, по величи­не погрешности, с которой задается правая часть ud
.


Описанный метод построения приближенных решений называется методом регуляризации.


3.2. О решении вырожденных и плохо обусловленных систем линейных алгебраических уравнений


3.2.1. Известно, с какими трудностями связано решение так называемых плохо обусловленных систем линей­ных алгебраических уравнений: малым изменениям пра­вых частей таких систем могут отвечать большие (выхо­дящие за допустимые пределы) изменения решения.


Рассмотрим систему уравнений


А
z
=
u
,
(3; 2,1)


где А —
матрица с элементами aij
, А
={aij
}, z — иско­мый вектор с координатами zj
,
z={zj
}, и —
известный вектор с координатами и
i
,
u
= {ui
}, i, j =1, 2, ..., п
.
Система (3; 2,1) называется вырожденной,
если опреде­литель системы равен нулю, detA = 0.
В этом случае матрица А
имеет равные нулю собственные значения. У плохо обусловленных систем такого вида матрица А
имеет близкие к нулю собственные значения.


Если вычисления производятся с конечной точностью, то в ряде случаев не представляется возможным уста­новить, является ли заданная система уравнений вырож­денной или плохо обусловленной. Таким образом, плохо обусловленные и вырожденные системы могут быть не­различимыми в рамках заданной точности. Очевидно, такая ситуация имеет место в случаях, когда матрица А
имеет достаточно близкие к нулю собственные значения.


В практических задачах часто правая часть и
и эле­менты матрицы А,
т. е. коэффициенты системы (3; 2,1), известны приближенно. В этих случаях вместо системы (3;
2,1)
мы имеем дело с некоторой другой системой Az=и
такой, что ||A-A||<=h, ||u-u||<= d, где смысл норм обычно определяется характером задачи. Имея


вместо матрицы А
матрицу A, мы тем более не можем высказать определенного суждения о вырожденности или невырожденности системы (3; 2,1).


В этих случаях о точной системе А
z=u
, решение которой надо определить, нам известно лишь то, что для матрицы А
и правой части и
выполняются неравенства


||A-A||<=h, ||u-u||<= d. Но систем с такими исходными данными (А, и)
бесконечно много, и в рамках извест­ного нам уровня погрешности они неразличимы. Поскольку вместо точной системы (3; 2,1) мы имеем приближенную систему А
z=
и,
то речь может идти лишь о нахождении приближенного решения. Но приближенная система А
z

может быть неразрешимой. Возникает вопрос:


что надо понимать под приближенным решением систе­мы (3; 2,1) в описанной ситуации?


Среди «возможных точных систем» могут быть и вы­рожденные. Если они разрешимы, то имеют бесконечно много решений. О приближенном нахождении какого из них должна идти речь?


Таким образом, в большом числе случаев мы должны рассматривать целый класс неразличимых между собой (в рамках заданного уровня погрешности) систем урав­нений, среди которых могут быть и вырожденные, и неразрешимые. Методы построения приближенных реше­ний систем этого класса должны быть одними и теми же, общими. Эти решения должны быть устойчивыми к малым изменениям исходных данных (3; 2,1).


В основе построения таких методов лежит идея «от­бора». Отбор можно осуществлять с помощью специальных, заранее задаваемых функционалов W[ z ] , входящих в постановку задачи.


Неотрицательный функционал W[ z ] , определенный на всюду плотном в F подмножестве F1
множества F, называется стабилизирующим функционалом,
если:


а) элемент zT
принадлежит его области определения;


б) для всякого числа d>0 множество F1,d
элементов z из F1
, для которых


W[ z ]<=d, компактно на F.


3.2.2. Итак, рассмотрим произвольную систему линейных алгебраических уравнений (короче — СЛАУ)


Аz =u, (3; 2,2)


в которой z и u—векторы, z=(z1
, z2
, ...,zn
) ÎRn
, и
=(u1
,u2
, ...
,un
) ÎRm
, А—
матрица с элементами aij
, А
= {aij
}, где j =1, 2, ..., n; i= 1, 2, ..., т,
и число п
не обязано быть равным числу т.


Эта система может быть однозначно разрешимой, вы­рожденной (и иметь бесконечно много решений) и не­разрешимой.


Псевдорешением
системы (3; 2,2) называют вектор z, минимизирующий невязку || Az – u || на всем пространстве Rn
. Система (3; 2,2) может иметь не одно псевдоре­шение. Пусть FA
есть совокупность всех ее псевдореше­ний и z1
— некоторый фиксированный вектор изRn

,
оп­ределяемый обычно постановкой задачи.


Нормальным относительно вектора
z1
решением си­стемы (3;2,2) будем называть псевдорешение z0
с ми­нимальной нормой || z – z1
||, т. е. такое, что


|| z0
– z1
|| =


Здесь . В дальнейшем для простоты записи будем считать z1
= 0 и нормальное относительно вектора z1
=0 решение называть просто нормальным ре­шением.


Для любой системы вида (3; 2,2) нормальное решение существует и единст­венно.


Замечание 1. Нормальное решение z° системы (3;2,2) можно определить также как псевдорешение, минимизирующее заданную положительно определенную квадратичную форму относительно координат вектора z—z1
. Все излагаемые ниже результаты остаются при этом справедливыми.


Замечание 2. Пусть ранг матрицы А
вырожден­ной системы (3; 2,1) равен r <
n и zr+1
,zr+2
, … , zn
— базис линейного пространства N
A
,
состоящего из элемен­тов z, для которых А
z
=
0
,
NA
= {z; А
z
=
0}. Решение z° системы (3; 2,1), удовлетворяющее n—r условиям ортогональности


(z0
– z1
, zS
)= 0, S= r + 1, r + 2, .. ,n, (3; 2,3)


определяется однозначно и совпадает с нормальным ре­шением.


3.2.3. Нетрудно видеть, что задача нахождения нормаль­ного решения системы (3; 2,2) является некорректно поставленной. В самом деле, пусть А —
симметричная матрица. Если она невырожденная, то ортогональным преобразованием


z = Vz*, u = Vu*


ее
можно привести к диагональному виду и преобразо­ванная система будет иметь вид


li
zi
*=ui
* , i= 1, 2,. ..,п,


где li
— собственные значения матрицы А.


Если симметричная матрица А —
невырожденнаяи имеет ранг r, то n – r ее собственных значений равны нулю. Пусть


li
¹0 для i=1, 2, ..., r;


и


li
=0 для i=r+1,r+2, …, n.


Полагаем, что система (3; 2,2) разрешима. При этом ui
*= 0 для i =r + 1, ..., n.


Пусть «исходные данные» системы (А
и и)
заданы с погрешностью, т. е. вместо А
и и
заданы их прибли­жения А
и u
:


|| A – A ||<=h, ||u – u||<=d. При этом


(3;2,4)


Пусть li

собственные значения матрицы А.
Извест­но, что они непрерывно зависят от А в норме (3; 2,4). Следовательно, собственные значения lr+1
, lr+2
, …,ln
могут быть сколь угодно малыми при достаточно малом h.


Если они не равны нулю, то


zi
*=.


Таким образом, найдутся возмущения системы в пре­делах любой достаточно малой погрешности А
и и,
для которых некоторые zi
* будут принимать любые наперед заданные значения. Это означает, что задача нахожде­ния нормального решения системы (3; 2,2) является неустойчивой.


Ниже дается описание метода нахождения нормального решения системы (3; 2,2), устойчивого к малым (в норме (3; 2,4)) возму­щениям правой части и
,
основанного на методе регуляризации.


3.3
. Метод регуляризации нахождения нормального решения


3.3.1. Пусть z° есть нормальное решение системы


А
z
= и.
(3; 3,1)


Для простоты будем полагать, что прибли­женной может быть лишь правая часть, а оператор (матрица) А —
точный.


Итак, пусть вместо и
мы имеем вектор и,
|| и — и
||<=d ;т. е. вместо системы (3;3,1) имеем систему




(3; 3,2)



Аz = u.

Требуется найти приближение zd
к нормальному реше­нию системы (3;3,1), т. е. к вектору z° такое, что zd
-z° при d-0. Отметим, что векторы u и u (один из них или оба) могут не удовлетворять классическому ус­ловию разрешимости.


Поскольку система (3; 3,1) может быть неразреши­мой, то inf ||Az-u|| = m >=0, где inf берется по всем векторам zÎ Rn
.


Естественно искать приближения zd
в классе Qd
век­торов z, сопоставимых по точности с исходными данны­ми, т. е. таких, что || Az – u ||<=m+d. Но поскольку вместо вектора u мы имеем вектор u, то мы можем найти лишь


m=inf || Az – u ||.


zÎ Rn


Отметим, что из очевидных неравенств


||Az – u ||<=||Az – u || + || u – u || ,


||Az – u ||<= || Az – u || + ||u – u ||


следуют оценки m<=m+d, m<=m+d, приводящие к не­равенству | m — m|<=d. Поэтому будем искать прибли­жение zd
к нормальному решению z° в классе Qd
векто­ров z, для которых ||А
z
— и
|| <
=
m+2d. Отметим, что если имеется информация о разрешимости системы (3;3,1), то m = 0 ив качестве класса Qd
можно брать класс векторов z, для которых ||А
z


и
|
| <
=
d. Класс Qd
есть класс формально возможных приближенных решений.


Но нельзя в качестве zd
брать произвольный вектор из класса Qd
,
так как такое «приближение» будет неустойчивым к малым изменениям правой части уравнения (3;3,2). Необходим принцип отбора. Он естественным образом вытекает из постановки задачи. В самом деле согласно определению нормального решения искомое ре­шение z° должно быть псевдорешением с минимальной нормой. Поэтому в качестве приближения к z° естествен­но брать вектор zd
из Qd
,
минимизирующий функционал


W[ z ] = ||z||2
на множестве Qd
.


Таким образом, задача сводится к минимизации функ­ционала W[ z ] = ||z||2
на множестве Qd
векторов z, для которых выполняется условие || А
z

u
|| <=m+2d.


3.3.2. Пусть zd
— вектор из Qd
, на котором функционал ||z||2
достигает минимума на множестве Qd
. Его можно рассматривать как результат применения к правой части u уравнения (3; 3,2) некоторого оператора R1
(
u
,
d), зависящего от параметра d. Справедлива


Теорема 1.
Оператор R1
(u, d)
обладает следующи­ми свойствами:


1)
он определен для всякогоu
ÎRm
и любогоd > 0;


2
)
приd-
0
z
d
==
R1
(u, d)
стремится к нормальному решениюz
°
уравнения Аz=u, т. е. он является регуляризирующим для уравнения Аz=u .


3.3.3. Пусть zd
— вектор, на котором функционал W[ z ] = ||z||2
достигает минимума на множестве Qd
. Легко ви­деть из наглядных геометрических представлений, что вектор zd
лежит на границе множестваQd
,

т.е. ||Azd
- u ||=m+2d=
d1
.


Это следует непосредственно также из того, что функционал W[ z ] = ||z||2
является сстабилизирующим и квазимонотонным. Стабилизирующий функционал W[ z ] называется квазимонотонным , если каков бы ни был элемент z из F1
, не принадлежащий множеству M0
, в любой его окрестности найдется элемент z1
из F1
, для которого W[ z1
]< W[ z ], т.е. если функционал не имеет локальных минимумов на множестве F1
M0
.

Задачу нахождения вектора zd
можно поставить так:среди векторов z, удовлетворяющих условию ||Az – u ||=
m+2d, найти вектор zd
с минимальной нормой, т. е. минимизирующий функционал W[ z ]=||z||2
.


Последнюю задачу можно решать методом Лагранжа, т. е. в качестве zd
брать вектор za
, минимизирующий функционал


Мa
[z, u] = ||Az - u ||2
+ a||z||2
,a>0,


с параметром a, определяемым по невязке, т. е. из ус­ловия ||Аza
— u||=d1. При этом параметр aопределяется однозначно .


3.3.4. Поскольку Мa
[z, u] —
квадратичный функционал, то для любых u ÎRm
и a> 0 существует лишь один минимизирующий его вектор za
. В самом деле, допустим,


что существуют два вектора za
и za
, минимизирующие его. Рассмотрим векторы z, расположенные на прямой (пространства Rn
)

, соединяющей za
и za
:


z = za
+ b(za
-za
).


Функционал Мa
[z, u] на элементах этой прямой есть неотрицательная квадратичная функция от b. Следова­тельно, она не может достигать наименьшего значения при двух различных значениях b: b = 0 (z=
za
) иb=1 (z=
za
).


Компоненты zj
a
вектора za
являются решением си­стемы линейных алгебраических уравнений



получающихся из условий минимума функционала Мa
[z, u]:



Здесь



Компоненты zj
a
могут быть определены и с помощью какого-нибудь другого алгоритма минимизации функцио­налаМa
[z, u].


Вектор za
можно рассматривать как результат приме­нения к u некоторого оператора za
=R(u, a), завися­щего от параметра a.


Покажем, что оператор R0
(u, a) является регуляризирующим для системы (3;3,1), т. е. обладает свойствами 1) и 2) определения 2 (см. 3.1.2.). В п. 3.3.2. было сказано, что он определен для всяких u ÎRm
и a> О и, следовательно, обладает свойством 1). Теперь пока­жем справедливость свойства 2), т. е. существование таких функций a=a(d) , что векторы za(d)
= R0
(u,
a(d)) сходятся к нормальному решению z° системы (3; 3,1) при d-0. Это непосредственно следует из приводимой ниже теоремы 2.


Теорема 2( Тихонова). Пусть z° есть нормальное решение си­стемы Az=u и вместо вектора u мы имеем вектор u такой, что ||u—u||<=d. Пусть, далее,b1(d)и b2(d) — какие-либо непрерывные на [0, d2] и положительные на (0, d2] функции, монотонно стремящиеся к нулю при d- 0 и такие, что



Тогда для любой .положительной на (0, d2] функции a=a(d) , удовлетворяющей условиям



векторы za(d)
= R0
(u,a(d)) сходятся к нормальному ре­шению z0
системы Az = u при d-0, т. е.



Примечание. Доказательства теорем в данном разделе опущены, т.к. основной теоретической частью работы является раздел «Метод Подбора. Квазирешения». Метод Тихонова описан из-за использования его в численном эксперименте.


ЗАКЛЮЧЕНИЕ


Для реализации численного примера был выбран метод Тихонова решения плохо обусловленных СЛАУ. В качестве исходной была взята СЛАУ Az=u, имеющая в матричной записи вид:



Определитель матрицы коэффициентов этой системы близок к нулю – он равен 0.000125. Попробуем решить эту систему с помощью обратной матрицы:


z=A-1
u


Получим z1
=316


z2
=-990


z3
=832


Теперь предположим, что правая часть нам известна приближенно, с погрешностью 0.1 Изменим, к примеру, третий элемент вектора-столбца с 1 на 1.1 :



Попробуем решить новую систему также с помощью обратного оператора. Мы получаем другой результат:


z1
=348


z2
=-1090


z3
=916.


Мы видим, что малому изменению правой части данной системы отвечают весьма значительные изменения решения. Очевидно, эта система – плохо обусловленная, и здесь не может идти речи о нахождении решения близкого к точному с помощью обратного оператора.


Будем искать решение методом Тихонова. В теоретической части было показано, что целесообразно использовать регуляризирующий оператор следующего вида: (aE + AT
A)za
=AT
ud
, где E – единичная матрица, za
-- приближенное нормальное решение, AT
– транспонированная исходная матрица, a -- параметр регуляризации,


ud
-- правая часть, заданная неточно. Эту задачу можно решать стандартными методами, задав предварительно функцию a=a(d) , удовлетворяющую условиям теоремы Тихонова. В моем примере это функция a(d)=d/4d
. Далее будем решать регуляризованную задачу с точностью e=0.001 ,последовательно изменяя значения a.


В качестве контр-примера можно подставить в программу любую функцию a(d) , не удовлетворяющую условиям теоремы Тихонова. Любая положительная функция монотонно возрастающая, не обладающая свойством a(d)-0 при d-0, не будет минимизировать невязку.


Текст программы приведен в приложении 1. Полная распечатка результатов приведена в приложении 2. Здесь же представлены окончательные значения на выходе из программы.


Приближение к нормальному решению


Z(1)= 3.47834819174013E+0002


Z(2)=-1.08948394975175E+0003


Z(3)= 9.15566443137791E+0002


Значение правой части при подстановке прибл. решения


U1(1)= 9.99997717012495E-0001


U1(2)= 1.00000741970775E+0000


U1(3)= 1.09948402394883E+0000


Значение параметра регуляризации:


2.61934474110603E-0010


ПРИЛОЖЕНИЯ

Приложение 1.


Текст программы для реализации метода Тихонова на языке PASCAL


Uses CRT;


type


real=extended;


const


matrixA: array[1..3,1..3] of real = ((-19/20,1/5, 3/5),


(-1 ,0.1, 0.5),


(-0.01 ,0 ,1/200));


One: array [1..3,1..3] of real = ((1,0,0),


(0,1,0),


(0,0,1));


U:array[1..3] of real = (1,1,1.1);


var


i,j,k,q:byte;


A,At,A1,A2,Ar,One1:array[1..3,1..3] of real;


delta,Det,S,alpha:real;


B,Z,U1:array[1..3] of real;


f:text;


Procedure TransA;


begin


for i:=1 to 3 do


for j:=1 to 3 do


At[i,j]:=A[j,i]


end;


Function Koef(par1,par2:byte):real;


var


Sum:byte;


Tmp:real;


begin


Sum:=par1+par2;


Tmp:=1;


for k:=1 to sum do


Tmp:=Tmp*(-1);


Koef:=Tmp;


end;


Function AlAdd(par1,par2:byte):real;


type


element=record


value:real;


flag:boolean;


end;


var


BB:array[1..2,1..2] of real;


AA:array[1..3,1..3] of element;


k,v,w:byte;


N:array[1..4] of real;


P1:real;


begin


for v:=1 to 3 do


for w:=1 to 3 do begin


AA[v,w].value:=A2[v,w];


AA[v,w].flag:=true


end;


for v:=1 to 3 do AA[par1,v].flag:=false;


for v:=1 to 3 do AA[v,par2].flag:=false;


{ for v:=1 to 3 do begin


for w:=1 to 3 do write(AA[i,j].value:2:3,' ');


writeln


end; }


k:=1;


for v:=1 to 3 do


for w:=1 to 3 do


begin


if AA[v,w].flag then


begin


N[k]:=AA[v,w].value;


{ writeln(N[k]);}


k:=k+1


end;


end;


BB[1,1]:=N[1]; BB[1,2]:=N[2];


BB[2,1]:=N[3]; BB[2,2]:=N[4];


{ writeln('alg dop',par1,par2,' ',BB[1,1]*BB[2,2]-BB[1,2]*BB[2,1]);}


AlAdd:=BB[1,1]*BB[2,2]-BB[1,2]*BB[2,1];


end;


Function DetCount:real;


var


S1:real;


z:byte;


begin


S1:=0;


for z:=1 to 3 do S1:=S1+A2[1,z]*Koef(1,z)*AlAdd(1,z);


DetCount:=S1;


end;


Procedure RevMatr;


begin


for i:=1 to 3 do


for j:=1 to 3 do


Ar[j,i]:=Koef(i,j)*AlAdd(i,j)/DetCount;


{ for i:=1 to 3 do begin


for j:=1 to 3 do write(Ar[i,j],' ');


writeln;


end;}


end;


Function AllRight:boolean;


begin


writeln(f,'­Ґўп§Є Ї® 1-¬г н«-вг',(abs(U[1]-U1[1])));


writeln(f,'­Ґўп§Є Ї® 2-¬г н«-вг',(abs(U[2]-U1[2])));


writeln(f,'­Ґўп§Є Ї® 3-¬г н«-вг',(abs(U[3]-U1[3])));


writeln(F);


if (abs(U[1]-U1[1])<0.001) and (abs(U[2]-U1[2])<0.001) and


(abs(U[3]-U1[3])<0.001) then AllRight:=true


else AllRight:=false


end;


Function Pow(par1:real;par2:byte):real;


var


S2:real;


z:byte;


begin


S2:=1;


if par2=0 then begin


Pow:=1;


exit


end


else


for z:=1 to par2 do S2:=S2*par1;


Pow:=S2;


end;


BEGIN


clrscr;


Assign(f,'c:tikh.txt');


Rewrite(f);


for i:=1 to 3 do


for j:=1 to 3 do


A[i,j]:=matrixA[i,j];


TransA;


Det:=0.000125;


{----------------------------}


for i:=1 to 3 do begin


S:=0;


for j:=1 to 3 do begin


S:=S+At[i,j]*U[j];


B[i]:=S


end;


end;


{----------------------------}


for i:=1 to 3 do


for j:=1 to 3 do


begin


S:=0;


for k:=1 to 3 do begin


S:=S+At[i,k]*A[k,j];


A1[i,j]:=S


end


end;


{-----------------------------}


q:=1;


repeat


alpha:=q/pow(4,q);


for i:=1 to 3 do


for j:=1 to 3 do


One1[i,j]:=One[i,j]*alpha;


for i:=1 to 3 do


for j:=1 to 3 do


A2[i,j]:=One1[i,j]+A1[i,j];


RevMatr;


{------------------------------}


for i:=1 to 3 do begin


S:=0;


for j:=1 to 3 do begin


S:=S+Ar[i,j]*B[j];


Z[i]:=S


end;


end;


for i:=1 to 3 do begin


S:=0;


for j:=1 to 3 do begin


S:=S+A[i,j]*Z[j];


U1[i]:=S


end


end;


q:=q+1;


until AllRight;


{------------------------------}


clrscr;


writeln('ЏаЁЎ«Ё¦Ґ­ЁҐ Є ­®а¬ «м­®¬г аҐиҐ­Ёо');


for i:=1 to 3 do writeln('Z(',i,')=',z[i]);


writeln;


writeln('‡­ 祭ЁҐ Їа ў®© з бвЁ ЇаЁ Ї®¤бв ­®ўЄҐ ЇаЁЎ«. аҐиҐ­Ёп');


for i:=1 to 3 do writeln('U1(',i,')=',U1[i]);


writeln;


writeln('‡­ 祭ЁҐ Ї а ¬Ґва ॣг«паЁ§ жЁЁ:');


writeln(alpha);


Close(f);


readln;


END.


Приложение 2.


Распечатка результатов пересчета на каждом шаге


невязка по 1-му эл-ту 7.75620788018006E-0002


невязка по 2-му эл-ту 9.12970302562861E-0002


невязка по 3-му эл-ту 1.09101153877771E+0000


невязка по 1-му эл-ту 3.51667654246499E-0002


невязка по 2-му эл-ту 4.81631787337596E-0002


невязка по 3-му эл-ту 1.09057642915500E+0000


невязка по 1-му эл-ту 8.14255746519741E-0003


невязка по 2-му эл-ту 1.75271999674588E-0002


невязка по 3-му эл-ту 1.09024740493812E+0000


невязка по 1-му эл-ту 1.64128226088452E-0004


невязка по 2-му эл-ту 1.40420815653456E-0003


невязка по 3-му эл-ту 1.09002512985506E+0000


невязка по 1-му эл-ту 1.09651876415789E-0003


невязка по 2-му эл-ту 8.01044623892439E-0003


невязка по 3-му эл-ту 1.08980075500722E+0000


невязка по 1-му эл-ту 3.24092274239579E-0003


невязка по 2-му эл-ту 1.28969442769472E-0002


невязка по 3-му эл-ту 1.08943309314635E+0000


невязка по 1-му эл-ту 4.29878415191160E-0003


невязка по 2-му эл-ту 1.47864580098997E-0002


невязка по 3-му эл-ту 1.08840358157784E+0000


невязка по 1-му эл-ту 4.64764022304719E-0003


невязка по 2-му эл-ту 1.53489294761093E-0002


невязка по 3-му эл-ту 1.08488736141985E+0000


невязка по 1-му эл-ту 4.70263264899617E-0003


невязка по 2-му эл-ту 1.53524096326819E-0002


невязка по 3-му эл-ту 1.07252416252061E+0000


невязка по 1-му эл-ту 4.54618391386039E-0003


невязка по 2-му эл-ту 1.47935415193105E-0002


невязка по 3-му эл-ту 1.03007092553528E+0000


невязка по 1-му эл-ту 3.97950585276394E-0003


невязка по 2-му эл-ту 1.29378307693635E-0002


невязка по 3-му эл-ту 9.00028069734717E-0001


невязка по 1-му эл-ту 2.71895340473448E-0003


невязка по 2-му эл-ту 8.83742514077426E-0003


невязка по 3-му эл-ту 6.14624514462952E-0001


невязка по 1-му эл-ту 1.25089904346179E-0003


невязка по 2-му эл-ту 4.06552487723671E-0003


невязка по 3-му эл-ту 2.82729125073012E-0001


невязка по 1-му эл-ту 4.15581257891512E-0004


невязка по 2-му эл-ту 1.35064829843828E-0003


невязка по 3-му эл-ту 9.39264706989556E-0002


невязка по 1-му эл-ту 1.18814900667952E-0004


невязка по 2-му эл-ту 3.86149131520602E-0004


невязка по 3-му эл-ту 2.68533566153482E-0002


невязка по 1-му эл-ту 3.22671215741144E-0005


невязка по 2-му эл-ту 1.04868192738639E-0004


невязка по 3-му эл-ту 7.29267248287954E-0003


невязка по 1-му эл-ту 8.61328853146714E-0006


невязка по 2-му эл-ту 2.79931897352870E-0005


невязка по 3-му эл-ту 1.94668264668650E-0003


невязка по 1-му эл-ту 2.28298750498679E-0006


невязка по 2-му эл-ту 7.41970775380851E-0006


невязка по 3-му эл-ту 5.15976051172231E-0004


Приближение к нормальному решению


Z(1)= 3.47834819174013E+0002


Z(2)=-1.08948394975175E+0003


Z(3)= 9.15566443137791E+0002


Значение правой части при подстановке прибл. решения


U1(1)= 9.99997717012495E-0001


U1(2)= 1.00000741970775E+0000


U1(3)= 1.09948402394883E+0000


Значение параметра регуляризации:


2.61934474110603E-0010


СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1.А.Н.ТИХОНОВ, В.Я.АРСЕНИН «МЕТОДЫ РЕШЕНИЯ НЕКОРРЕКТНЫХ ЗАДАЧ» – МОСКВА «НАУКА» 1979.


2.Г.И.МАРЧУК «МЕТОДЫ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ» – МОСКВА «НАУКА» 1977.


3.Л.И.ГОЛОВИНА «ЛИНЕЙНАЯ АЛГЕБРА И НЕКОТОРЫЕ ЕЕ ПРИЛОЖЕНИЯ» – МОСКВА «НАУКА» 1975.


4.В.И.РАКИТИН, В.Е.ПЕРВУШИН «ПРАКТИЧЕСКОЕ РУКОВОДСТВО ПО МЕТОДАМ ВЫЧИСЛЕНИЙ» – МОСКВА «ВЫСШАЯ ШКОЛА» 1998.


5.В.В.ФАРОНОВ «ПРОГРАММИРОВАНИЕ НА ПЕРСОНАЛЬНЫХ ЭВМ В СРЕДЕ TURBO PASCAL» -- ИЗДАТЕЛЬСТВО МГТУ 1990.

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Методы решения некорректно поставленных задач

Слов:9019
Символов:75688
Размер:147.83 Кб.