آنالیز تخصیص قطعی

از ویکی‌پدیا، دانشنامهٔ آزاد

آنالیز تخصیص قطعی (به انگلیسی: Definite assignment analysis) در علوم کامپیوتر، آنالیز جریان داده‌ای است که توسط کامپایلرها استفاده می‌شود تا به‌طور محافظه کارانه مطمئن شویم که یک متغیر یا آدرس، همیشه قبل از استفاده، تخصیص داده شده باشد.

هدف[ویرایش]

در برنامه‌های C و C ++، یکی از منشاهای خطاهایی که تشخیص آن‌ها بسیار دشوار است، رفتار غیرقطعی‌ حاصل خواندن متغیرهای تعریف نشده است. این رفتار می‌تواند بین سیستم عامل‌ها، ساخت‌ها و حتی بین اجراهای مختلف متفاوت باشد.


دو راه متداول برای حل این مشکل وجود دارد. یکی این است که اطمینان حاصل شود که همه‌ی مکان‌ها قبل از خواندن، نوشته شده‌اند. قضیه رایس ثابت می‌کند که این مشکل به طور کلی برای همه‌ی برنامه‌ها قابل حل نیست. با این حال، می‌توان یک تحلیل محافظه کارانه (غیر دقیق) به وجود آورد که فقط برنامه‌هایی را بپذیرد که این محدودیت را برآورده کنند، در حالی که برخی از برنامه‌های صحیح را رد کرد، و تحلیل تخصیص قطعی چنین تحلیلی است. مشخصات زبان برنامه نویسی جاوا[۱] و سی شارپ[۲] مستلزم آن است که کامپایلر یک خطای زمان کامپایل را در صورت شکست آنالیز، گزارش کند. هر دو زبان به شکل خاصی از تحلیل نیاز دارند که با جزئیات دقیق بیان شده باشد. در جاوا، این تجزیه و تحلیل توسط استارک و همکارانش رسمیت یافت و برخی از برنامه‌های صحیح رد می‌شوند و باید برای معرفی تخصیص غیر ضروری و مشخص تغییر داده شوند. در سی شارپ، این تجزیه و تحلیل توسط Fruja رسمیت یافت، و دقیق و درست است، به این معنا که همه متغیرهای تخصیص داده شده در طول تمام مسیرهای جریان کنترل، به طور قطعی، اختصاص داده شده در نظر گرفته می شوند.[۳] زبان سایکلون نیز به برنامه‌ها نیاز دارد که تجزیه و تحلیل تخصیص مشخصی را انجام دهند، اما فقط روی متغیرهایی با انواع پوینتر، تا انتقال برنامه‌های سی آسان شود.[۴]

راه دوم برای حل این مشکل این است که همه‌ی مکان‌ها را به یک مقدار ثابت و قابل پیش بینی در نقطه‌ای که در آن تعریف شده اند به طور خودکار مقداردهی کنیم ، اما این وظایف جدیدی را معرفی می کند که ممکن است عملکرد را مختل کند. در این حالت ، تجزیه و تحلیل تکلیف قطعی ، بهینه سازی کامپایلر را امکان پذیر می کند که در آن تکالیف اضافی — تکالیفی که پس از آن تکالیف دیگر دنبال می شوند و هیچ خوانشی احتمالی در آن‌ها وجود ندارد — قابل حذف است. در این مورد ، هیچ برنامه ای رد نمی شود ، اما برنامه‌هایی که تجزیه و تحلیل آن‌ها در تعیین تکلیف مشخص نمی تواند شامل مقداردهی اولیه اضافی باشد. زیرساخت زبان مشترک متکی بر این رویکرد است. [۵]

واژه شناسی[ویرایش]

می‌توان گفت که یک متغیر یا آدرس، در طول برنامه، در یکی از سه حالت زیر قرار دارد:

  • به طور قطعی اختصاص داده شده: متغیر با قطعیت مشخص است که تخصیص داده شده است.
  • قطعاً تخصیص داده نشده: متغیر به طور قطعی مشخص است که تخصیص داده نشده است.
  • ناشناخته: متغیر ممکن است اختصاص داده شده باشد یا نشده باشد. تجزیه و تحلیل به اندازه‌ی کافی دقیق نیست که تعیین کند کدام است.

آنالیز[ویرایش]

موارد زیر بر اساس رسمی‌سازی Fruja در تجزیه و تحلیل تخصیص قطعی درون رویه‌ای (تک روشی) سی شارپ است، که مسئول اطمینان از تخصیص همه متغیرهای محلی قبل از استفاده از آن‌ها است.[۶] آن را به طور همزمان تجزیه و تحلیل تخصیص مشخص و انتشار ثابت مقادیر بولین انجام می‌دهد. ما پنج تابع استاتیک را تعریف می کنیم:

نام دامنه توضیح
قبل تمام عبارات متغیرهایی که قبل از ارزیابی عبارت، اختصاص داده شده‌اند.
بعد تمام عبارات متغیرهایی که قطعاً پس از ارزیابی عبارت، با فرض اینکه به طور معمول کامل شود، اختصاص داده می شوند.
vars تمام عبارات همه متغیرهای موجود در محدوده‌ی عبارت داده شده.
درست تمام عبارات بولین متغیرهایی که پس از ارزیابی عبارت داده شده، با فرض درست بودن عبارت، قطعاً اختصاص داده می‌شوند.
نادرست تمام عبارات بولین متغيرهایی که قطعاً پس از ارزيابي عبارت، با فرض نادرست بودن عبارت، تخصيص داده مي شوند.

ما معادلات جریان داده را ارائه می کنیم که مقادیر این توابع را در عبارات مختلف بر حسب مقادیر توابع در زیرعبارات نحوی آن‌ها تعریف می‌کند. فرض کنید که هیچ دستوری برای رسیدگی به دستورات goto، break، continue، return یا کنترل استثنا وجود ندارد. چند نمونه از این معادلات به صورت زیر است:

  • هر عبارت e که بر مجموعه متغیرهایی که به طور قطعی اختصاص داده شده‌اند، تأثیر نمی‌گذارد: after(e) = before(e)
  • فرض کنید e عبارت تخصیص loc = v باشد. آنگاه before(v) = before(e) و after(e) = after(v) U {loc}.
  • فرض کنید e عبارت «درست» باشد. آنگاه true(e) = before(e) و false(e) = vars(e). به عبارت دیگر، اگر e مقدار «نادرست» را بگیرد، همه‌ی متغیرها (به صورت خالی) به طور قطعی اختصاص داده می شوند، زیرا e مقدار «نادرست» را نگرفته است.
  • از آنجایی که آرگومان‌های متد از چپ به راست ارزیابی می شوند، before(argi + 1) = after(argi). پس از تکمیل یک متد، پارامترهای خروجی قطعاً اختصاص داده شده‌اند.
  • فرض کنید s عبارت شرطی if (e) s1 else s2 باشد. آنگاه before(e) = before(s), before(s1) = true(e), before(s2) = false(e), و after(s) = after(s1) intersect after(s2).
  • فرض کنید s عبارت حلقه‌ی while (e) s1 باشد. آنگاه before(e) = before(s), before(s1) = true(e), and after(s) = false(e).
  • و غیره ...


در ابتدای روش، هیچ متغیر محلی به طور قطعی تخصیص داده نمی‌شود. تأیید کننده به طور مکرر روی درخت نحو انتزاعی مرور می‌کند و از معادلات جریان داده برای انتقال اطلاعات بین مجموعه‌ها استفاده می‌کند تا به یک نقطه ثابت برسد. سپس، تأییدکننده مجموعه‌ی «قبل»، از هر عبارتی که از متغیر محلی استفاده می‌کند، بررسی می‌کند تا مطمئن شود که حاوی آن متغیر است.

این الگوریتم با معرفی پرش‌های کنترل جریان مانند goto، break، continue، return و کنترل خطا، پیچیده می شود. هر عبارتی که می‌تواند هدف یکی از این پرش‌ها باشد، باید مجموعه‌ی «قبل» خود را با مجموعه متغیرهای قطعی اختصاص داده شده در منبع پرش، تقاطع بدهد. هنگامی که این‌ها معرفی می شوند، جریان داده‌ی حاصل ممکن است چندین نقطه ثابت داشته باشد، مانند این مثال:

 int i = 1;
 L:
 goto L;

از آنجایی که می‌توان به برچسب L دو مکان دسترسی یافت، معادله کنترل جریان برای goto حکم می کند که before(2) = after(1) با before(3) تقاطع دارد. اما before(3) = before(2)، پس before(2) = after(1) با before(2) تقاطع دارد. این دارای دو نقطه ثابت برای before(2), {i} و مجموعه‌ی تهی است. با این حال، می‌توان نشان داد که به دلیل شکل یکنواخت معادلات جریان داده، یک نقطه ثابت ماکسیمال منحصر به فرد (نقطه ثابت با بزرگترین اندازه) وجود دارد که بیشترین اطلاعات ممکن را در مورد متغیرهای قطعی اختصاص داده شده ارائه می‌دهد. چنین ماکسیمال (یا ماکسیمم) نقطه ثابت ممکن است با تکنیک‌های استاندارد محاسبه شود. به تحلیل جریان داده رجوع کنید. یک مسئله دیگر این است که یک پرش جریان کنترلی ممکن است برخی جریان‌های کنترلی را غیرممکن کند. به عنوان مثال، در این قطعه کد، متغیر i قطعا قبل از استفاده، اختصاص داده شده است:

 int i;
 if (j < 0) return; else i = j;
 print(i);

معادله جریان داده برای if می گوید که after(2) = after(return) پس از (i = j) متقاطع می‌شوند. برای اینکه این کار به درستی انجام شود، تعریف می‌کنیم after(e) = vars(e) برای همه‌ی پرش‌های کنترل جریان. این به همان دلیل تایید شده است که معادله false(true) = vars(e) است؛ زیرا امکان ندارد کنترل بلافاصله پس از پرش جریان کنترل، به نقطه‌ای برسد.

پانویس[ویرایش]

  1. «Java SE Specifications». docs.oracle.com. دریافت‌شده در ۲۰۲۱-۱۲-۱۲.
  2. «ECMA-334». Ecma International (به انگلیسی). دریافت‌شده در ۲۰۲۱-۱۲-۱۲.
  3. www.jot.fm http://www.jot.fm/issues/issue_2004_10/article2/. دریافت‌شده در ۲۰۲۱-۱۲-۱۲. پارامتر |عنوان= یا |title= ناموجود یا خالی (کمک)
  4. «Cyclone: Definite Assignment». cyclone.thelanguage.org. دریافت‌شده در ۲۰۲۱-۱۲-۱۲.
  5. "Standard ECMA-335, Common Language Infrastructure (CLI)". ECMA International. pp. Section 1.8.1.1 (Partition III, pg. 19). Retrieved December 2, 2008.
  6. www.jot.fm http://www.jot.fm/issues/issue_2004_10/article2/. دریافت‌شده در ۲۰۲۱-۱۲-۱۲. پارامتر |عنوان= یا |title= ناموجود یا خالی (کمک)