בחינה 1, חלק 1 · שיעור פתרון

שאלה 4: קמירות ואופטימיזציה קלאסית

נוסח השאלה

  1. א. יהיו f(x) ו-g(x) פונקציות קמורות. האם f(x)g(x) בהכרח קמורה? האם היא בהכרח לא קמורה? הסבירו.
  2. ב. יהי a קבוע אי־שלילי. אם f(x) קמורה, האם af(x) בהכרח קמורה? הסבירו.
  3. ג. פתרו את בעיית האופטימיזציה:
    max  x(30-x) + y(50-2y) - 3x - 5y - 10z x + y ≤ z z ≤ 17.25
  4. ד. כיצד ישתנה ערך פונקציית המטרה אם האילוץ האחרון ישתנה ל-z ≤ 17.35?

זיהוי השיטה

שני הסעיפים הראשונים עוסקים בכללי קמירות ודורשים הוכחה או דוגמה נגדית. בסעיפים ג-ד פונקציית המטרה קעורה והאילוצים ליניאריים, ולכן תנאי KKT מאפשרים למצוא ולאמת אופטימום גלובלי ולפרש את השינוי באילוץ.

  1. 1. קמירותבודקים טענות באמצעות הגדרה ונגזרות
  2. 2. KKTלגראנז', תנאי יציבות ורפיון משלים
  3. 3. רגישותכופל האילוץ ובדיקה ישירה

פתרון מודרך

א מכפלה של פונקציות קמורות

נוסח הסעיף: האם מכפלת שתי פונקציות קמורות בהכרח קמורה, והאם היא בהכרח לא קמורה?

הרעיון: המילה "בהכרח" נבדקת באמצעות דוגמאות. צריך להציג מקרה שבו המכפלה אינה קמורה ומקרה שבו היא כן קמורה.

מקרה שבו המכפלה אינה קמורה: נבחר על כל הישר הממשי:

f(x) = x²,   g(x) = x h(x) = f(x)g(x) = x³ h″(x) = 6x

f קמורה ו-g ליניארית ולכן גם קמורה. אבל h″(x) שלילית כאשר x < 0 וחיובית כאשר x > 0, ולכן אינה קמורה על כל הישר.

מקרה שבו המכפלה קמורה:

f(x) = x²,   g(x) = x⁴ h(x) = x⁶,   h″(x) = 30x⁴ ≥ 0

שתי הפונקציות קמורות, וגם המכפלה שלהן קמורה.

תוצאת הסעיף: המכפלה אינה בהכרח קמורה, אך גם אינה בהכרח לא קמורה. אין כלל חד-משמעי; בודקים את המכפלה עצמה.

ב כפל בקבוע אי־שלילי

נוסח הסעיף: אם f(x) קמורה ו-a ≥ 0, האם af(x) קמורה?

הרעיון: משתמשים ישירות באי־שוויון שמגדיר קמירות ומכפילים את שני אגפיו במספר שאינו משנה את כיוון האי־שוויון.

לכל שתי נקודות u,v בתחום ולכל t ∈ [0,1], קמירות f נותנת:

f(tu + (1-t)v) ≤ tf(u) + (1-t)f(v)

מכפילים ב-a ≥ 0:

af(tu + (1-t)v) ≤ taf(u) + (1-t)af(v)

זהו בדיוק אי־שוויון הקמירות עבור הפונקציה af. כאשר a=0 מתקבלת פונקציה קבועה, שגם היא קמורה.

תוצאת הסעיף: כן. כפל פונקציה קמורה בקבוע אי־שלילי שומר על קמירות.

ג פתרון בעיית האופטימיזציה

נוסח הסעיף: מצאו את x,y,z שממקסמים את פונקציית המטרה תחת שני האילוצים.

הרעיון: מפשטים את המטרה, מסדרים את האילוצים בצורת הקורס gᵢ≤bᵢ, בונים לגראנז' של בעיית מקסימום ומאמתים את תנאי KKT. הקעירות והאילוצים הליניאריים מבטיחים שהפתרון הוא גלובלי.

נסמן את פונקציית המטרה ב-F(x,y,z) ונפתח סוגריים:

F(x,y,z) = -x² + 27x - 2y² + 45y - 10z

מטריצת הסיאן של F היא:

H = diag(-2, -4, 0)

diag(-2,-4,0) היא מטריצה אלכסונית שהערכים שעל האלכסון שלה הם -2,-4,0. היא שלילית למחצה, ולכן F קעורה. שני האילוצים ליניאריים, ולכן תנאי KKT מספיקים לאופטימום גלובלי.

נכתוב את האילוצים בצורת הקורס gᵢ(x,y,z)≤bᵢ:

g₁(x,y,z) = x+y-z ≤ b₁ = 0 g₂(x,y,z) = z ≤ b₂ = 17.25

המרווחים הם b₁-g₁=z-x-y ו-b₂-g₂=17.25-z. נסמן ב-λ₁≥0 וב-λ₂≥0 את הכופלים של האילוצים, בהתאמה. במקסימום, לפי מוסכמת הקורס, מוסיפים למטרה כל כופל כפול המרווח:

L = -x² + 27x - 2y² + 45y - 10z     + λ₁(z-x-y) + λ₂(17.25-z)

תנאי היציבות (סטציונריות) מתקבלים מגזירה לפי כל משתנה:

∂L/∂x = 27 - 2x - λ₁ = 0 ∂L/∂y = 45 - 4y - λ₁ = 0 ∂L/∂z = -10 + λ₁ - λ₂ = 0

מאחר שמקדם z במטרה הוא -10, לכל x,y כדאי לבחור את z הקטן ביותר שמותר. לכן האילוץ הראשון פעיל:

z = x + y

נציב z=x+y במטרה. מתקבלת פונקציה בשני משתנים:

φ(x,y) = -x² + 17x - 2y² + 35y
  1. גוזרים לפי x ומשווים לאפס. ∂φ/∂x = -2x + 17 = 0   ⇒   x = 8.5
  2. גוזרים לפי y ומשווים לאפס. ∂φ/∂y = -4y + 35 = 0   ⇒   y = 8.75
  3. מחשבים את z ובודקים את האילוץ העליון. z = x+y = 8.5+8.75 = 17.25

כעת נמצא את הכופלים. מהמשוואה לפי x:

λ₁ = 27 - 2 · 8.5 = 10 λ₂ = λ₁ - 10 = 0

שני האילוצים פעילים, אך הכופל של האילוץ השני הוא אפס. תנאי הרפיון המשלים מתקיימים: λ₁(b₁-g₁)=0 ו-λ₂(b₂-g₂)=0. זוהי גם תזכורת לכך שאילוץ פעיל אינו מחייב כופל חיובי.

ערך המטרה:

F(8.5,8.75,17.25) = 225.375

תוצאת הסעיף: הפתרון האופטימלי הוא (x*,y*,z*)=(8.5,8.75,17.25), ערך המטרה המרבי הוא 225.375, והכופלים הם (λ₁,λ₂)=(10,0).

ד שינוי האילוץ ל-z ≤ 17.35

נוסח הסעיף: כיצד ישתנה ערך המטרה אם אגף ימין של האילוץ האחרון יגדל מ-17.25 ל-17.35?

הרעיון: במקסימום ובמוסכמת gᵢ≤bᵢ, שינוי קטן באגף ימין נותן ΔF*≈+λᵢΔbᵢ. כאן הכופל אפס, ואפשר גם לאמת שהפתרון הישן נשאר אופטימלי לאחר ההרפיה.

השינוי באגף ימין הוא:

Δb = 17.35 - 17.25 = 0.10 ΔF* ≈ +λ₂ · Δb = 0 · 0.10 = 0

הנקודה (8.5,8.75,17.25) עדיין אפשרית, וכעת יש לה מרווח 17.35-17.25=0.10 באילוץ השני. עם λ₂=0 היא עדיין מקיימת את כל תנאי KKT, ולכן נשארת אופטימלית.

תוצאת הסעיף: ערך פונקציית המטרה אינו משתנה ונשאר 225.375.

תשובה סופית

  1. א. מכפלת פונקציות קמורות אינה בהכרח קמורה ואינה בהכרח לא קמורה.
  2. ב. אם a ≥ 0, אז af(x) קמורה.
  3. ג. (x*,y*,z*)=(8.5,8.75,17.25), F*=225.375, ו-(λ₁,λ₂)=(10,0).
  4. ד. שינוי הגבול ל-17.35 אינו משנה את הפתרון או את ערך המטרה.

המשך במבחן

בחינה 1, חלק 1 · שאלה 4

זהו פתרון השאלה האחרון במבחן.

חזרה לרשימת המבחנים