«بارها اندیشیدهام که اگر نویسندهای فرایندی را که یکی از آثارش گامبهگام تا نقطهٔ نهاییِ اتمام پیموده است شرح دهد، چه مقالهٔ خواندنیای برای یک مجله رقم خواهد خورد. نمیدانم چرا تاکنون چنین نوشتهای به جهان عرضه نشده است؛ بیشتر نویسندگان—بهویژه شاعران—مایلاند چنین پنداشته شود که آفریدههایشان محصول نوعی شورِ ظریف یا شهودِ وجدآور است، و حقیقتاً از آن میهراسند که به خوانندگان اجازه دهند پشت صحنه را ببینند؛ چرخها و چرخدندهها، سازوکار جابهجاییِ صحنه، نردبانها و تلههای دیوان، پرهای خروس، رنگ سرخ و وصلههای سیاه که در نود و نه مورد از صد، سازوبرگِ بازیگرِ ادبی را تشکیل میدهند. […] در سراسر شعر کلاغ، حتی یک نقطه را نمیتوان به تصادف یا شهود نسبت داد؛ این اثر گامبهگام، تا رسیدن به کمال، با دقت و ضرورتِ سختگیرانهٔ مسئلهای ریاضی پیش رفته است.»
آنچه خواندید بخشی از مقاله «فلسفه ترکیب» از ادگار آلن پو (۱۸۰۹ بوستون – ۱۸۴۹) بود. او پدر داستانهای گوتیک و جنایی و از پایهگذاران جنبش رمانتیکگرایی در امریکا بود. پو، چهار سال قبل از مرگش، شعر معروف کلاغ (غراب) را منتشر کرد. شعری که نمیدانیم آیا طی چند ساعت یا طی چند سال نوشته شده است. با این وجود، یک سال پس از انتشار کلاغ، پو مقالهای مینویسد به اسم «فلسفه ترکیب» و در آن با جزئیات زیادی روند خلق کلاغ را توضیح میدهد؛ روندی بر اساس قدمهای حساب شده و با دقت و ظرافت برداشته شده . درست جوری که یک معمار با توجهای به طرحی که در سر دارد نقشهای میکشد و بر آجر به آجر بنایش نظارت میکند. در این مقاله پو وانمود میکند که خلق یک داستان یا شعر، محصول یک فرایند مشخص است نه یک الهام یا نبوغ لحظهای. هر چند که ادعای پو کمی اغراقآمیز به نظر میرسد و ممکن است پس از نوشتن شعر و در اثر فکر کردن زیاد به ساختارش به این جزئیات زیاد رسیده باشد و به گونهای بیشبرازش کرده باشد، با این وجود، مقاله «فلسلفه ترکیب» نکتههای جالبی در مورد فرایند تولید یک اثر هنری و پشت صحنه یک اثر فاخر به ما نشان میدهد.
شعر کلاغ روایت دانشجوی پریشان حالی است که در یک روز سرد زمستانی، در حالی که در در فراق معشوقهاش «لنور» در حال سوختن است، در خانهاش را میزنند. در را که باز میکند کلاغی وارد اتاقش میشود و رو ی سردیس آتنا مینشید. دانشجو با کلاغ شروع به حرف زدن میکند اما کلاغ در پاسخ به هر پرسش او فقط میگوید «هرگز دگر – Nevermore».
در مقاله فلسفه ترکیب، پو میگوید که سرایش کلاغ، ابتدا برایش یک ایده انتزاعی بوده؛ او میخواسته شعری بسازد در فضایی تیره با لحنی سوگناک و سرشار از مالیخولیا. برای همین ابتدا به ساختارش فکر کرده و تصمیم گرفته که شعری دورانی بنویسد که هر بندش با یک واژهٔ مشخص تمام شود. گامِ نخست برای گزینش واژه، انتخابِ صدا بوده. کدام واکه (vowel) بیش از هر چیز اندوه را در گوشِ شنونده مینشاند؟ واکهٔ کشیدهٔ «ــُــ» (/oː/). سپس دنبال صامتی رفت که در کنار این واکه، هالهای سرد و ماتمزده بسازد؛ «ر» (/r/). ترکیبِ «ـُـ + ر» صدایی است که در واژههای مثل lore، core، door، Lenore…شنیده میشود. پو ادعا میکند در این مرحله، از بین واژهها، بیهیچ جستوجو یا مکثی Nevermore به ذهنش رسیده. سپاس انتهای شعر را در نظر میگیرد. اوج روایت را مینویسند و تصمیم میگیرد هر چیز دیگری که از قرار است نوشته شود به اوج داستان لطمهای نزند.
بیشتر آثار پو رازآلود، ترسناک و از همه مهمتر، کوتاه هستند. او معتقد بود پس از شعر منظوم، «داستان کوتاه» بهترین قالب برای نوشتن است چرا که اگر اثری را در یک نشست نشود خواند، وحدت تاثیر«unity of effect» از بین میرود. از طرف دیگر، پو انتظار دارد که شاعر یا نویسنده در فضا و زمان محدودی که دارد چنان زبردستی در انتخاب واژهها و جملات به خرج دهد که از همان ابتدا همه عناصر با چفت و بس محکمی در خدمت ایجاد تاثیر چیده شوند. به همین خاطر برای پو، اندازه و ساختار یک اثر ادبی برایش مثل یک مسئله ریاضی مهم است. او همچنین ابتدا پایان داستانش را میداند و سپس به شروع نگارش و تنظیم کردن همه جزئیاتی میکند که خواننده را به مقصدی که او میخواهد برساند. برای پو، بارها و بارها ویرایش کردن و و دوباره نویسی یک جز تا زمانی که در هماهنگی خوبی با کل قرار بگیرند و پیچیدگی لازم را ایجاد کند امری واجب است.
«اگر از ما میخواستند […] قالبی را برگزینیم که بتواند بیش از هر نوع دیگر نوشتار، نیازهای نبوغ والا را برآورد و میدانِ شایستهای برای نمودِ تواناییهایش فراهم کند، بیدرنگ از «قصۀ منثور» نام میبُردیم. […] همین که خواننده، لحظهای دست از خواندن بکشد، خود به خود برای برهمزدنِ وحدت واقعی اثر کفایت میکند. حال آنکه در داستان کوتاه، نویسنده مجال مییابد مقصود خویش را به تمامی به اجرا برساند. […] اما اگر جملهٔ آغازین او در خدمت آفریدنِ این تأثیر نباشد، نویسنده در همان گام نخست ناکام مانده است.»
در شعر کلاغ، پرسشهای ابتدایی مرد جوان، پرسشهای معمولی هستند و باور مرد این است که کلاغ فقط همین «هرگز دگر» را از صاحب قبلیاش یادگرفته و طوطیوار در واکنش به هر چیزی آن را میگوید. تا اینکه کمکم، مرد عاشق از بیاعتنایی اولیه بیرون آمده و از آن لفظ اندوهبار و تکرارِ پیدرپی آن و با به خاطر آوردن شهرت شوم کلاغ، سوالهای جدیتری میکند. مرد که ابتدا باور داشت که کلاغ جز این چیز دیگری نمیتواند بگوید رفته رفته باور میکند که او از سر خباثت و خصیصهٔ پیشگویانه یا شیطانیاش است که این گونه پاسخ میدهد. او از سر خودآزاری و تا حدی خرافهباوری برانگیخته میشود تا پرسشهایی از پرنده بکند که پاسخ پیشبینیشدهٔ «هرگز دگر» بیشترین لذت اندوه را نصیبش سازد. این به زجر و اندوه مرد جوان دامن میزند و رفته رفته او را به جنون میکشاند. با کشاندنِ این خودآزاری به نهایت، داستان تمام میشود.
در ادامه، ترجمه فارسی فلسفه ترکیب آمده. اصل شعر را در اینجا و ترجمه دکتر محمد دهقانی از آن را در انتهای این نوشته میتوانید بخوانید.
اگر $n$ جسم و $n+1$ نخ را بهصورت یک در میان به یکدیگر متصل کنیم و مجموعه را بهطور قائم بیاویزیم، با پایین کشیدن نخ آخر، بسته به اینکه چه شتابی به آن داده باشیم، یکی از نخها پاره میشود. در این مقاله به حل کلی این مسئله که کدام نخ پاره خواهد شد میپردازیم. بخش اول مقاله به فرمولبندی ریاضی مسئله با در نظر گرفتن نخها بهصورت فنرهایی با ثابتهای بهاندازه کافی بزرگ و بخش دوم به بررسی دو حالت خاص $n=1$ و $n=2$ اختصاص مییابد.
نگاره ۱: اجسام آویزان از سقف
فرمولبندی مسئله
$n$ جسم و $n+1$ نخ آنطور که در شکل ۱ نشان داده شده است را در نظر میگیریم. جرم هرکدام از اجسام را برابر $m$ و نخها را بی جرم فرض میکنیم. همانطور که در شکل مشخص است، سیستم در شتاب گرانش $g$ قرار دارد. به نخ پایین نیروی ثابت $F$ را وارد میکنیم بهطوری که شتاب ثابت $a$ را به سمت پایین به انتهای نخ آخر بدهد. برای بهدست آوردن زمان پاره شدن نخها، ابتدا $x_i(t)$ها را که در شکل مشخص شدهاند بهدست میآوریم. بعد از این کار کافی است فرض کنیم که اگر نخها بهاندازه $\Delta l$ کشیده شوند پاره میشوند.
برای بررسی حرکت دستگاه، نخها را بهصورت فنرهایی با طول اولیه $l_0$ و ثابت $k$ در نظر میگیریم. وقتی این مجموعه را بهطور قائم بیاویزیم، طول نخ $p$ام (از بالا) بهاندازه $\Delta l_p = (n-p+1)mg/k$ افزایش مییابد که ناشی از وزن اجسام است. در این حالت با انتخاب نقاط مرجع مناسب میتوانیم تابع انرژی پتانسیل را بهصورت زیر تعریف کنیم.
توجه کنید که $x_p(t)$ از محل تعادل جرم شماره $p$ (از بالا) و $x_0=0$ در نظر گرفته شده. در واقع در این حالت جملات ثابتی نیز باید در انرژی پتانسیل دستگاه در نظر گرفت که به علت عدم تأثیر در معادلات حرکت از نوشتن آنها صرفنظر کردهایم.
با توجه به اینکه $m\ddot{x}_p = -\partial U / \partial x_p$، معادلات حرکت را میتوان چنین نوشت:
همچنین $C_{p1} = (pa/2(n+1))$ و $C_{p2}=0$ است. $C_{p3} = (map/6k(n+1))(p^2-n(n+2)-1)$ و با توجه به شرایط اولیه $x_p(0) = \dot{x}_p(0) = 0$، ضرایب $A_{pj}$ و $B_{pj}$ نیز مشخص میشوند. با مشخص شدن $x_j(t)$ها، میتوانیم معادلات مربوط به پاره شدن نخها را بهدست آوریم. برای این کار کافی است فرض کنیم که وقتی نخها بهطور مشخص $L$ میرسند پاره میشوند. پس زمان پاره شدن نخها را باید از روابط زیر بهدست آوریم:
زمان پاره شدن نخ $p$ام، $t_p$، با قرار دادن $x_{p-1}$ و $x_p$ در معادلهٔ $p$ام (از بالا) دستگاه معادلات (۳) و حل آن بهدست میآید. با مقایسهٔ مقادیر زمانهای لازم برای پاره شدن نخها میتوانیم نخی را که در اثر کشیدن انتهای پایینی مجموعه پاره میشود مشخص کنیم. از آنجا که که بررسی جوابها حتی در حالت $n=1$ به سبب وجود جملات مثلثاتی کار آسانی نیست از روشهای عددی استفاده میکنیم و مسئله را در حالتهای خاص (یک و دو جسم) بررسی میکنیم.
حالت خاص n=1
فرض کنید فقط یک جسم داریم. این مسئله معمولاً در درس مکانیک مقدماتی برای دانشجویان مطرح میشود و بهطور کیفی نیز به آن پاسخ داده میشود. در اینجا به حل کمی این مسئله میپردازیم. در این حالت، معادله حرکت جسم چنین است:
پس معادلات مربوط به زمان پاره شدن نخها چنیناند ($l = mg/k$):
$$\Delta l \mathbin{-} l = \frac{a}{2\omega^2}( \cos(\omega t_1)\mathbin{-} 1) + \frac{a}{4}t^2_1, \quad (۴)$$ $$\Delta l = \frac{-a}{2\omega^2}( \cos(\omega t_2)\mathbin{-} 1) + \frac{a}{4}t^2_2.$$
پارامترهای مؤثر در زمان پاره شدن نخ $k/m$ ، $\Delta l$ و $a$ هستند. ابتدا حالتی خاص را بررسی میکنیم. فرض کنید $k/m$ هزار بر مجذور ثانیه و $\Delta l$ دو میلیمتر باشد. این مقادیر گستره بزرگی از حالتهای معمول و قابل آزمایش در مورد این مسئله را در بر میگیرند. با حل عددی و بهدست آوردن $t_1$ و $t_2$ از معادلات (۴) بهازای این مقادیر $k/m$ و $\Delta l$ و برای چندین شتاب مختلف نمودار شکل ۲ بهدست میآید. این نمودار نشان میدهد که (برای شتابهایی در بازه مشخص شده در شکل) برای شتابهای بهاندازه کافی بزرگ، نخ پایینی و برای شتابهای کم، نخ بالایی پاره میشود این نتیجهگیری با درک شهودی ما از مسئله کاملاً توافق دارد.
اکنون شتاب مربوط به نقطه برخورد در این حالت را پیدا میکنیم. فرض کنید $t=t_1=t_2$. دو طرف معادلات (۴) را با هم جمع میکنیم و $t$ را بهدست میآوریم. اکنون اگر مقدار $a$ در $t=2\sqrt{(2\Delta l \mathbin{-} l)/a}$ را در یکی از معادلهها قرار دهیم و تعریف کنیم $\beta = \sqrt{\left(\frac{\Delta l}{l} \mathbin{-} 1\right)}$ و $\alpha = \sqrt{\frac{a}{4g}}$ نتیجه میشود:
نگاره ۲: نمودار زمان پاره شدن نخها برحسب شتاب در حالت n=1.
نمودار تابع $F(x) = x^2\big(\cos(\beta/x) \mathbin{-} 1 \big) + \frac{1}{2}$ در شکل ۳ برای حالتی که در آن $\beta = \beta_1 \approx 1.755$ رسم شده است. با حل معادله $F(x) = 0$ (به وسیله کامپیوتر)، ریشه $0.507$ (که در شکل ۳ مشخص شده است) به دست می آید. یعنی شتاب لازم برای پاره شدن همزمان نخها تقریبا ده متر بر مجذور ثانیه است. که با نمودار شکل ۲ توافق دارد.
برای اینکه ثابت کنیم معادله $F(x) = 0$ فقط همین یک ریشه را دارد، کافی است ثابت کنیم که $F'(x)$ به ازای مقادیر $x$ بزرگتر از $\alpha$ نزولی است. این کار را میتوان با محاسبه $F'(x)$ و تقریب زدن $\cos(\beta/x)$ و $\sin(\beta/x)$ با چند جمله از بسط سری آنها به سادگی نشان داد. بنابراین $F(x) = 0$ فقط یک ریشه دارد.
اکنون نشان میدهیم که در همه حالتهای مورد بحث، موضوع به همین شکل است. یعنی همواره یک نقطه برخورد وجود دارد که برای شتابهای کوچکتر از شتاب آن نقطه، نخ بالایی و برای شتابهای بزرگتر از شتاب آن نقطه، نخ پایینی پاره میشود. ابتدا این موضوع را که معادله ۵ یک و فقط یک ریشه دارد، به مقادیر منطقی و مورد بحث در این مقاله تعمیم میدهیم (منظور از مقادیر مورد بحث $\beta$ بعدا مشخص میشود). فرض کنید که بخواهیم معادله (۵) را برای $\beta \approx \beta_2$ بررسی کنیم. اگر $d=\beta_2/\beta_1$ و $\beta_1 = 1.755$ در این صورت با تغییر متغیر $X = x/d$ حل معادله مورد نظر متناظر با یافتن ریشه $H(X)=0$ است که در آن
نمودار تابع $H$ از انتقال تابع $F$ به دست میآید. ولی نمودار $F(x)$ اگر تا جایی به پایین انتقال پیدا کند که قسمت تناوبی آن بالای محور $x$ قرار گیرد، نمودار فقط در یک نقطه با این محور برخورد خواهد کرد. با توجه به شکل ۳ میتوان دریافت که اگر انتقال حدوداً کمتر از $0.4$ واحد باشد یعنی اگر $(1/2) \mathbin{-} (1/2d^2) \leq 0.4$، این برخورد صورت نمیگیرد. این شرط با توجه به اینکه در نمودار شکل ۲ داریم $\Delta l/l \approx 2$ متناظر با این است که $\Delta l/l \leq 8$ باشد.
اما در چه حالتهایی بیش از یک نقطه برخورد وجود دارد؟ $\Delta l/l>8$ نشان میدهد که افزایش طول لازم برای پاره شدن نخ، هشت برابر طولی است که در ابتدا با وصل کردن جسم به آن داده میشود. این موضوع نشان میدهد که مقدار کش آمدن نخ و یا ثابتی که برای آن انتخاب کردهایم در مقابل جسم جرم آنقدر زیاد است که تاثیر جسم در پاره شدن نخ، که به صورت جمله نوسانی و مقدار $l$ در معادلات ظاهر میشود، تقریبا از بین میرود. زیرا اگر $\Delta l$ بسیار بزرگتر از $l$ باشد، از معادلات (۴) نتیجه میشود که تاثیر وجود جسم، که به صورت جمله کسینوس و همچنین کاهش مقدار کششی لازم برای پاره شدن نخ بالایی از $\Delta l$ به $\Delta l \mathbin{-} l$ ظاهر میشود، رفته رفته از بین میرود. بنابراین فقط حالتهایی را بررسی میکنیم که نسبت $\Delta l/l$ در حدی باشد که نقش وجود جسم در پاره شدن نخ کاملاً مشخص باشد. به همین دلیل است که در ابتدا جرمی بین دو نخ در نظر میگیریم و دستگاه را به طور قائم در شتاب گرانش قرار میدهیم.
تا اینجا مشخص شد که به ازای تمامی حالتهایی که جسم — با تقریب ما برای آنها — وجود دارد، یک و فقط یک شتاب $a_0$ موجود است که هر نخ را همزمان پاره میکند. اکنون اگر نشان دهیم که شتابهایی مانند $a_1$ و $a_2$ وجود دارند که به ازای $a_c < a_1$ و $t_1 > t_2$ و به ازای $a_c >a_2$ و $t_1 < t_2$ آنچه میخواهیم به آسانی ثابت میشود. اگر معادلات (۴) را به صورت زیر بنویسیم:
چون جمله کسینوس کراندار است با کم کردن $a$ برای مقادیر ثابت $\omega, l, \Delta l$ تاثیر این جمله کم و بیش از بین میرود، بنابراین همیشه میتوانیم $a <a_0$ را آنقدر کوچک بگیریم که این جمله در معادلات قابل چشم پوشی باشد. در این صورت $t_1 = 2\sqrt{(\Delta l \mathbin{-} l)/a}$ و $t_2 = 2\sqrt{\Delta l/a}$. پس همواره از$a <a_0$ نتیجه میشود $t_1 <t_2$.
حالا فرض کنید که $t_1$ و $t_2$ در معادله (۴) بسیار کوچک باشند، به طوری که بتوانیم بسط سری کسینوس را به صورت زیر بنویسم:
$$\Delta l \mathbin{-} l \approx (1 \mathbin{-} \frac{\omega^2 t_1^2}{2} + \frac{\omega^4 t_1^4}{4}\mathbin{-}1) \frac{a}{2\omega^2} + \frac{1}{4}at_1^2, \quad (۶)$$ $$\Delta l \approx \frac{\omega^2 t_2^2}{2} \frac{a}{2\omega^2}+ \frac{1}{4}at_2^2$$
در این صورت، این جوابها بهدست میآیند: $t_{1} = \sqrt[4]{\frac{48\,(\Delta l \mathbin{-} l)}{a\,\omega^2}}$ و $t_{2} = \sqrt{\frac{2\,\Delta l}{a}}$.
با توجه به فرض بسیار کوچک بودن $t_{1}$ و $t_{2}$ و اینکه $a$ برای جواب هر دو زمان در مخرج ظاهر شده است، نتیجه میگیریم که برای مقادیر بسیار بزرگ $a$، جوابهای (۴) با تقریب خوبی به شکل (۶) هستند. با توجه به جواب $t_{1}$ و $t_{2}$ اگر $a<a_c$ آنگاه $t_2<t_1$ به طوری که $a_c = \frac{\Delta l^2 \omega^2}{2(\Delta l \mathbin{-} l)}$. پس برای شتابهای بزرگ و زمانهای کوچک میشود دید که $t_2<t_1$.
بنا بر آنچه گفته شد، با فرض اینکه نمودار جوابهای (۴) در محدودهٔ مورد بررسی ناپیوستگیهای قابل ملاحظهای نداشته باشد (که فرض معقولی است) میتوانیم این نتیجهگیری کلی را بکنیم که برای شتابهای به اندازهٔ کافی بزرگ نخ پایین و برای شتابهای کوچک، نخ بالایی پاره میشود. این مطابق با جوابی است که به صورت شهودی به این مسئله داده میشود.
حالت خاص n=2
برای دو جسم، معادلات زیر را در مورد زمان پاره شدن نخها بهدست آوریم:
$$\Delta l \mathbin{-} l_1= \frac{a}{2\omega_1^2} \cos(\omega_1 t_1)\mathbin{-}\frac{a}{6\omega_2^2} \cos(\omega_2 t_1)+\frac{1}{6}at_1^2 \mathbin{-} \frac{4a}{9\omega_1}),$$ $$\Delta l \mathbin{-}l_2 = \frac{a}{3\omega_2} \cos(\omega_2 t_2) +\frac{1}{6}at_2^2\mathbin{-}\frac{a}{9\omega_1^2},$$ $$\Delta l = \frac{1}{6}at_1^2 \mathbin{-} \frac{a}{2\omega_1^2}\cos(\omega_1t_3)\mathbin{-} \frac{a}{6\omega_2^2}\cos(\omega_2t_3) + \frac{5}{9\omega_1^2}a. \quad (۷)$$
که در این معادلات $\omega_1^2 = \frac{k}{m}, \omega_2^2 = \frac{3k}{m}, l_1 = \frac{2mg}{k}, l_2 = \frac{mg}{k}$.
مشخص است که معادلات (۷) نسبت به حالت $n=1$ بسیار پیچیدهترند و بحث در مورد آنها بسیار دشوارتر از حالت قبل است. در این حالت، به بررسی جوابها فقط در یک مورد خاص بسنده میکنیم.
دوباره مقادیر قبلی را برای $\Delta l$ و $k/m$ در نظر بگیرید. اگر جوابهای (۷) را برای شتابهای مختلف با کمک کامپیوتر بهدست بیاوریم، به نمودار شکل ۴ میرسیم. در این نمودار رفتار شتاب تا $50 \text{ms}^{-2}$ بررسی شده است. این نمودار نشان میدهد که در شتابهای معمولی نخ وسطی پاره نمیشود. حل عددی به ما نشان میدهد که شتاب لازم برای کوچکتر شدن $t_2$ از $t_3$ در حدود ۲۵۰ متر بر مجذور ثانیه است و برای اینکه $t_2$ از $t_1$ کوچکتر شود شتاب بسیار بیشتر که منطقی نیست لازم است. بنابراین آنچه که ما در شتابهای معمولی میبینیم این است که مانند حالت $n=1$ برای شتابهای بهاندازه کافی کوچک، نخ بالایی و برای شتابهای بزرگ نخ پایینی پاره میشود.
نگاره ۴: زمان پاره شدن هر یک از نخها
نتیجهگیری
نتایجی که در پایان حالتهای خاص گرفته شد، یعنی پاره شدن نخ بالایی برای شتابهای کم و نخ پایینی برای شتابهای زیاد، با درک فیزیکی ما از مسئله کاملاً سازگار است. جوابهایی که در کلاسهای درس مکانیک به حالت $n=1$ داده میشود بیشتر جنبه کیفی دارد ولی آنچه ما در اینجا نشان دادیم، بیانگر این موضوع است که این جوابهای کیفی با حل کمی نیز تأیید میشوند. در طول حل مسئله مواردی پیش آمد که به منظور جلوگیری از پراکنده شدن مطلب اصلی، اقدام به بیان دقیق و بررسی جزئیات و انجام اعمال ریاضی نکردیم؛ دقیقتر کردن این موارد با کسی حوصلهمند امکانپذیر است (نویسنده این کار را انجام داده است). در هر صورت با وجود ایرادهایی که به فرضهای اولیه ما وارد است، مثلاً اینکه طبیعت نخها مخصوصاً در آستانه پاره شدن به صورت یک فنر ایدهآل که ما فرض کردیم رفتار نمیکنند و یا فرضیههایی مانند برابر بودن جرم اجسام و یا ثابت بودن شتاب پایین کشیدن نخها که از کلیت مسئله میکاهد، موضوع جالب توجه اینجاست که جواب بهدست آمده با تقریب در نظر گرفتن نخها بهصورت فنر در محدوده مورد بررسی، کاملاً با تجربه سازگار است و شهود کیفی ما را از مسئله تأیید میکند.
سپاسگزاری
در اینجا لازم است از آقای دکتر محمود بهمنآبادی که برای حل این مسئله از راهنماییهای ارزنده ایشان استفاده کردهام تشکر کنم.
شرلوک هولمز در کتاب نشانهٔ چهار روشی را برای کشف حقیقت بهکار میبرد که میتوان اسمش را گذاشت روش حذف ناممکنها: وقتی همهٔ حالتهای ناممکن را کنار گذاشته باشی، آنچه باقی میماند، هرچهقدر هم نامحتمل، باید حقیقت باشد.
این روش، مثل بسیاری از روشهای دیگری که هولمز به کار میگیرد، جذاب و هیجانانگیز است ولی آیا در عمل و در شرایط واقعی هم میتوان چنین روشهایی را بههمان سادگی بهکار برد؟ واقعیت این است که در عمل ممکن است موانع فراوانی کاربردپذیری این روش را به چالش بکشد. در این یادداشت به دو مورد از این موانع نگاه دقیقتری میاندازیم. نخست این که تشخیص ناممکن بودن بعضی حالتها که در ابتدا محتمل بودهاند با چه دقتی انجام میشود؟ آیا ممکن نیست خطایی در این تشخیص وجود داشته باشد؟ مثلاً در همین مکالمه که از کتاب نشانهٔ چهار نقل شد هولمز به واتسن میگوید: «میدانیم که او از در یا از پنجره یا دودکش وارد نشده» این «میدانیم» چهقدر دقیق است؟ آیا ممکن است خطایی در مشاهده یا جمعآوری شواهد وجود داشته باشد که این نتیجهگیری را نادقیق کند؟ دوم این که آیا همهٔ حالتهای ممکن از ابتدا در نظر گرفته شدهاند؟ مثلاً آیا ممکن است که بهجز در، پنجره، دودکش و سوراخ سقف راه دیگری هم برای ورود به اتاق بوده باشد که از نظر کارآگاه دور مانده باشد؟ چنین اتفاقاتی تا چه اندازه میتواند اعتبار نتیجهگیری نهایی را به خطر بیندازد؟
هولمز در حالی که سرش را تکان میداد گفت: تو به توصیهٔ من عمل نمیکنی. چند بار به تو گفتهام که وقتی ناممکن را حذف کرده باشی، آنچه باقی میماند، هر قدر هم بعید، باید حقیقت باشد؟ میدانیم که او از در یا از پنجره یا دودکش وارد نشده. این را هم میدانیم که نمیتوانسته در اتاق پنهان شده باشد، چون مخفیگاهی وجود ندارد. پس از کجا آمده؟
– من فریاد زدم از سوراخ سقف آمده؟ – معلوم است که از آنجا آمده.
برای بررسی خطای آزمونهایی که حالتهای ناممکن را مشخص میکنند مثال سادهای در نظر میگیرم. فرض کنید $n+1$ جعبه داریم که در یکی از آنها یک توپ وجود دارد. جعبهها را با $1,2,\cdots, n , z$ برچسب میزنیم. هیچ اطلاعات اضافهٔ دیگری که بتواند راهنمایی برای تشخیص جعبهٔ محتوی توپ باشد نداریم، بنابراین فرض میکنیم که توپ میتواند با احتمال یکسان در هر یک از این $n+1$ جعبه باشد. (میتوان مسئله را به شکل عامتری هم طرح کرد، مثلاً میتوان فرض کرد که احتمال این که توپ در جعبهٔ شمارهٔ $i$ باشد $p_i$ است و $\sum_{i=1}^n p_i+p_z=1$.)
فرض کنید $A_i$ پیشامد قرار داشتن توپ در جعبهٔ شمارهٔ $i$ باشد. همچنین فرض کنید برای تشخیص این که یک جعبه توپی در درونش ندارد از آزمایشی مانند تکان دادن جعبه یا اسکن کردن آن با پرتو ایکس استفاده کنیم. پیشامدی را که در آن نتیجهٔ آزمایش روی جعبهٔ شمارهٔ $i$ خالی بودن آن را نشان میدهد $E_i$ مینامیم. این آزمایش ممکن است خطا داشته باشد، بهاین معنی که ممکن است توپ در جعبهٔ شمارهٔ $i$ باشد ولی نتیجهٔ آزمایش خلاف این را گزارش کند. احتمال چنین خطایی را با $r$ نشان میدهیم. به بیان ریاضی $P(E_i|A_i)=r$.
جعبههای شمارهٔ $1$ تا $n$ را آزمایش میکنیم و نتیجهٔ آزمایش این است که توپ در هیچ یک از این جعبهها نیست. طبق روش هولمز میتوانیم بگوییم که توپ قطعاً در جعبهٔ $z$ است. اما احتمال خطا در آزمایشهای ما وجود دارد و بنابراین ممکن است توپ در یکی از جعبههایی باشد که آزمایش خالی بودن آن را نشان داده. در چنین شرایطی نمیتوان گفت که توپ قطعاً در جعبهٔ $z$ است. سؤال درست این است که احتمال قرار داشتن توپ در جعبهٔ $z$ چهقدر است. چنین احتمالی با عبارت ریاضی زیر بیان میشود $$P(A_z|\bigcap_{i=1}^{n} E_i) = P(A_z|E_1\cap E_2\cap \cdots \cap E_n) = P(A_z \mid \mathcal{E}).$$ در اینجا $\mathcal{E} := \bigcap_{i=1}^{n} E_i$ اشتراک بین همه پیشامدهاست. با به کارگیری قاعدهٔ بیز: $$\begin{aligned} P(A_z \mid \mathcal{E}) = \frac{P(A_z \cap \mathcal{E})}{P(\mathcal{E})} \end{aligned}$$ و در نتیجه $$P(A_z \mid \mathcal{E})= \frac{P(\mathcal{E} \mid A_z)\, P(A_z)}{P(\mathcal{E} \mid A_z)\, P(A_z) + \sum_{i=1}^{n} P(\mathcal{E} \mid A_i)\, P(A_i)}$$
فرض میکنیم آزمایشهای جعبههای مختلف مستقل باشند یعنی آزمایش یک جعبه روی نتیجهٔ آزمایش یک جعبهٔ دیگر اثری نداشته باشد. در اینصورت خواهیم داشت $$P(\mathcal{E}|A_z)=(1-r)^n$$ زیرا اگر توپ در جعبهٔ شمارهٔ $z$ باشد یعنی همهٔ آزمایشها نتیجهٔ درست دادهاند و احتمال درست بودن نتیجهٔ هر آزمایش $1-r$ است. بههمین ترتیب بهسادگی میتوان دید که $$P(\mathcal{E}|A_i)=r(1-r)^{n-1}\,, i=1,2,\cdots , n$$ و بنابراین \begin{eqnarray} P & = & \frac{(1-r)P(A_z)}{r\left(1-P(A_z)\right)+(1-r)P(A_z)}\nonumber\ & = & \frac{1-r}{nr+1-r}\nonumber \end{eqnarray} که در آن از $P(A_z)=\frac{1}{n+1}$ استفاده کردهایم.
بیایید نگاهی به نتیجهٔ این رابطه برای یک حالت مشخص بیندازیم. فرض کنید ده جعبه داریم (یعنی $n=9 $) و آزمایش ما برای تشخیص خالی بودن جعبهها ده درصد خطا دارد (به این معنی که به طور میانگین از هر ده آزمایش یکی نتیجهٔ نادرست میدهد). در این صورت رابطهٔ بالا میگوید که $P=0.5$. یعنی احتمال این که توپ در جعبهٔ آخر (جعبهای که آزمایش نشده) باشد پنجاه درصد است. بهطور کلی اگر احتمال خطا در آزمایش تشخیص حالتهای ناممکن برابر با احتمال همان حالتی باشد که در آخر و پس از حذف ناممکنها قرار است بهعنوان «حقیقت» معرفی شود، خطای تشخیص حقیقت پنجاه درصد خواهد بود!
خطا در تعیین همهٔ حالتهای ممکن
ایراد دیگری که میتواند کارایی این روش را به چالش بکشد این است که از ابتدا همهٔ حالتهای ممکن را تشخیص نداده باشیم و بعضی از آنها از چشم ما دور مانده باشند. اگر به مثال بخش قبل برگردیم میتوانیم فرض کنیم که مثلاً یک جعبهٔ دیگر (جعبهٔ شمارهٔ $m$ وجود دارد) که در میان $n+1$ جعبهٔ موجود نیست و مثلاً پشت یک پرده مخفی شده است ولی توپ میتواند درون آن جعبه هم باشد. احتمال وجود توپ در آن جعبه را با $P(A_m)$ نشان میدهیم. بهعبارت دیگر اگرچه ما تصور میکنیم که حاصلجمع احتمالهای وجود توپ در $n+1$ جعبهٔ موجود برابر با یک است ولی درواقع این احتمال کوچکتر از یک است: $$\sum_{i=1}^n P(A_i)+P(A_z)=1-P(A_m)$$. بنابراین حتی اگر آزمایشهای ما بیخطا باشند و بگویند که توپ در جعبههای شمارهٔ $1$ تا $n$ نیست باز هم ممکن است جعبهٔ شمارهٔ $z$ را باز کنیم و ببینیم که خالی است. احتمال چنین نتیجهٔ ناگواری $P(A_m)$ است. برای اجتناب از مواجه شدن با چنین وضعیتی باید حداکثر تلاش را برای تشخیص و بهحسابآوردن همهٔ حالتهای ممکن به خرج داد.
بهعنوان آخرین مثال حالتی را در نظر میگیریم که هم آزمایشها احیاناً خطا داشته باشند و هم از ابتدا همهٔ حالتهای ممکن تعیین نشده باشند و مثلاً جعبهٔ شمارهٔ $m$ از قلم افتاده باشد. در این صورت بهسادگی میتوان دید که وقتی آزمایشها نشان میدهند که توپ در هیچ یک از جعبههای $1$ تا $n$ نیست، احتمال پیدا کردن توپ در جعبهٔ $z$ برابر است با $$P=\frac{(1-r)P(A_z)}{r(1-P(A_z)-P(A_m))+(1-r)(P(A_z)+P(A_m))}$$ و باز اگر همهٔ جعبهها را هماحتمال بگیریم، یعنی $$P(A_z)=P(A_m)=P(A_i)=\frac{1}{n+2}$$ خواهیم داشت $$P=\frac{1-r}{nr+2(1-r)}.$$ برای مقایسهٔ این نتیجه با نتیجهٔ بخش قبل فرض میکنیم تعداد همهٔ جعبههای در اختیار ما ده تاست (یعنی $n=9$) ولی تعداد کل جعبهها درواقع یازده تاست و احتمال وجود توپ در این یازده جعبه یکسان است ($\frac{1}{11}$). احتمال خطای آزمایش را هم مانند قبل ۰/۱ میگیریم. در اینصورت احتمال یافتن توپ در جعبهٔ $z$ برابر خواهد بود با $P=\frac{1}{3}$. بهعبارت دیگر آن حالتی را که با روش حذف ناممکنها حقیقت محض میدانیم فقط کمی بیش از سی درصد احتمال دارد که حقیقت باشد!
سخن پایانی
دنیای واقعی بر خلاف دنیای قصهها پر از عدم قطعیت، خطا و بیدقتی است. در چنین دنیایی دست یافتن به حقیقت به سادگی قصهها نیست. بنابراین برای پرهیز از نتیجهگیری نادرست یا پیشبینی نادرست بهتر است تا حد امکان نگاه همهجانبه به پدیدهها داشته باشیم و امکان بروز خطا در مشاهدهها و آزمایشها را نیز نادیده نگیریم.
پارادوکس «گربه و نان کرهای»—این پرسش طنزآمیز که اگر به پشت یک گربه تکهای نان تُست کرهمالشده ببندیم، چه خواهد شد؟ نان تُست همیشه از سمتِ کرهایاش روی زمین میافتد و گربهها هم همیشه روی پاهایشان فرود میآیند؛ اما این تضادِ بامزه، درواقع تنها یک شوخی ذهنی است. با این حال، تواناییِ واقعیِ گربهها در اینکه هنگام سقوط، بدنشان را بچرخانند و روی پا فرود آیند، شوخی نیست. این مسئله سالها ذهن دانشمندان را به خود مشغول کرده بود، چرا که به نظر میرسید با یکی از اصول مهم فیزیک، یعنی «پایستگی تکانه زاویهای»، ناسازگار باشد. اگر گربه را به شکل استوانهای صُلب تصور کنیم، چنین جسمی هنگام سقوط نمیتواند ناگهان تکانه زاویهای تولید کند؛ ولی گربهها این کار را به سادگی انجام میدهند.
در سال ۱۹۷۵، جک هدرینگتون، مقالهای نوشت و در سراسر آن از ضمیر «ما» استفاده کرد. وقتی سردبیر ژورنال اعلام کرد که باید نویسندهٔ دوم نیز وجود داشته باشد، هدرینگتون برای آنکه مجبور به تایپ دوبارهٔ مقاله نشود، اسم گربهاش «چستر» را بهعنوان همکار نویسنده درج کرد. اکنون این گربه یک پروفایل رسمی با اسم اِف. دی. سی. ویلارد در گوگل اسکالر دارد که نشان میدهد مقالاتش تا امروز ۱۱۳ بار مورد استناد پژوهشگران دیگر قرار گرفته است!
گربهها موجودات عجیبی هستند. از هر جایی و هر طوری که رهایشان کنی، دست آخر روی پنجه فرود میآیند. بدن گربه نه یک استوانهٔ صُلب، بلکه مجموعهای انعطافپذیر از دو بخشِ جداگانه است که میتواند در جهات مخالف یکدیگر خم شود و بچرخد. چگونگی انجام این کار، اولین بار در سال ۱۹۶۹ توسط یک مدل ریاضی توضیح داده شد. انعاطفپذیری زیاد گربهها و اینکه در هر ظرفی جا میشوند و شکل آن را به خود میگیرند هم سبب شده تا مردم به شوخی بگویند گربه مایع است. ارک-آنتوان فاردین، در مقالهای با عنوانِ «گربههای مایع»، از آنها برای توضیح چند مفهوم پایهای در رئولوژی (مطالعه جریان و تغییر شکل مواد) استفاده کند. این پژوهش شوخطبعانه باعث شد فاردین در سال ۲۰۱۷ جایزهٔ ایگ نوبل فیزیک را دریافت کند.
اما در دنیای فیزیک، مشهورترین گربه، «گربهٔ شرودینگر» است. این آزمایش فکری را اروین شرودینگر، ابتدا برای انتقاد از «تفسیر کپنهاگی مکانیک کوانتومی» مطرح کرد. هدف او تأکید بر تناقضی بود که در قلب نظریهٔ کوانتوم وجود داشت: گربهای که همزمان هم زنده و هم مرده است. شرودینگر شاید صرفاً به دنبال تأکید بر یک نکتهٔ عجیب و غیرمعمول بود؛ اما برهمنهیِ کوانتومی که گربهٔ فرضیاش توصیف میکند کاملاً واقعی است.
در فیزیکِ نور میتوان دو حالت نوری را که فازهای متفاوت و متضادی دارند با هم ترکیب کرد و وضعیتی به نام «حالت گربهای» ساخت. اگر شدت نور در چنین حالتی اندک باشد، به آن «حالت بچهگربهای» میگویند. این «حالتهای گربهای» صرفاً کنجکاوی نظری نیستند؛ آنها کاربردهایی جدی در حوزهٔ اطلاعات کوانتومی دارند. برای نمونه، «کدهای گربهای» یکی از روشهای معروف برای تصحیح خطا در رایانش کوانتومی هستند.
در داستان آلیس در سرزمین عجایب، «گربهٔ چشایر» میتواند بهتدریج ناپدید شود و تنها لبخندش را در هوا باقی بگذارد. اخیراً دانشمندان حالتی کوانتومی به نام «گربهٔ چشایرِ کوانتومی» را شناسایی کردهاند که در آن ویژگیهای یک ذره (مانند تکانهٔ مغناطیسی) میتواند از خودِ ذره جدا شده و در مسیر متفاوتی حرکت کند. این گربههای عجیب حتی میتوانند ویژگیهایشان (مانند همان لبخند معروف) را با هم مبادله کنند!
The physics of cats. Nat Rev Phys7, 165 (2025) https://doi.org/10.1038/s42254-025-00824-6
انسانها گاهی عقاید خود را در حین بحث با یکدیگر تغییر میدهند. محققان میتوانند با استفاده از ریاضیات این تغییر نظرات را در رویدادهای ساده شده زندگی روزمره بررسی کنند. این سناریوهای ساده شده که در واقع مدلهای ریاضی هستند به دانشمندان کمک میکنند تا تاثیر انسانها بر یکدیگر را از طریق ارتباطات اجتماعی بررسی کنند. در دنیای دیجیتال امروز این مدلها میتوانند به ما کمک کنند تا یاد بگیریم چگونه اطلاعات درست را ترویج و پخش کنیم و جلوی پخش اطلاعات نادرست را بگیریم. در این مقاله ما یک مدل ساده ریاضی برای تغییرات ایدهها، که برخاسته از بر همکنشهای اجتماعی است را بررسی میکنیم. ما به طور خلاصه شرح میدهیم که مدلهای تغییر نظرات چه به ما میگویند و چگونه دانشمندان سعی میکنند آنها را واقعیتر کنند. Front. Young Minds. 12:1253153. doi: 10.3389/frym.2024.1253153
دانشمندان چگونه تغییر نظرات را بررسی میکنند؟
در داستان کوتاه «به سوی ابدیت» نوشته الیزابت بر یکی از شخصیتهای داستان میگوید: عقاید همانند بچه گربهها هستند، مردم همیشه آنها را به دیگران میبخشند، همه نظراتی دارند نظرات ما در طول زمان تغییر میکنند و اکثر مواقع نظرات ما تاثیر گرفته از نظرات دیگران هستند. بسیاری از دانشمندان تغییر عقاید در طول زمان و اثر انسانها روی آنها را بررسی میکنند. آنها اغلب از ریاضیات برای بررسی این ایدهها و پیشبینی در مورد چگونگی تغییر دیدگاهها و شکلگیری دیدگاههای مشترک مردم استفاده میکنند.
تصور کنید که مدرسه شما در حال طراحی دوباره لوگوی مدرسه و رنگ آن باشد. مدیر مدرسه اعلام کرده است که هیئت امنای مدرسه دو رنگ ممکنه یعنی آبی و قرمز را انتخاب کردهاند و دانش آموزان میتوانند با رای گیری انتخاب کنند کدام یک از این دو رنگ اصلی مدرسه باشد. در طول ناهار شما و دوستانتان به دور یک میز نشستهاید و در حال بحث در مورد رنگ جدید هستید. فرض کنید که در هر زمان تنها دو نفر از شما در حال بحث در مورد رنگ باشند. همینطور فرض کنید که شما رنگ قرمز را ترجیح میدهید. شما به سمت یکی از دوستانتان برمیگردید تا در مورد رنگ بحث کنید. دوستتان به شما میگوید که رنگ آبی روی تیشرتهای مدرسه بهتر به نظر میرسد و شما را متقاعد میکند که آبی را ترجیح دهید. بعد از آن دوست دیگری به سمت شما برمیگردد تا در مورد رنگ با شما صحبت کند و شما این دوستتان را متقاعد میکنید که او هم آبی را ترجیح دهد. تصور کنید که این صحبتهای دوتایی تا زمانی که در نهایت همه سر میز ناهار متقاعد شوند که یک رنگ را انتخاب کنند ادامه داشته باشد.
ما میتوانیم فرآیند مباحثهای که گفته شد را با یک مدل ریاضی بررسی کنیم. محققان از مدلهای ریاضی استفاده میکنند تا تغییر نظرات به خاطر برهم کنشهای اجتماعی را بررسی کنند، همانند آنچه که در صحبتهای میز غذا رخ داد. محققان اغلب مدلهای ساده را که به راحتی قابل فهم هستند را بررسی میکنند. یکی از مدلهایی که محققان برای بررسی آنچه مثل شرایطی که در بالا گفته شد استفاده میکنند مدل «رای دهنده» نام دارد که برخلاف نامش هیچ ربطی به رای دادن ندارد. مدلهای رای دهنده دو جز کلیدی دارند اول: نظر ابتدایی مردم یعنی چیزی که مردم قبل از بحث کردن با دیگران فکر میکنند و دوم یک قانون به روز رسانی: که چگونگی تغییر عقاید مردم را توصیف میکند. در مثال ما عقاید اولیه رنگهای آبی و قرمزی هستند که دانشآموزان در ابتدا ترجیح میدهند. برای قانون به روز رسانی در مدل رای دهنده ما به طور تصادفی دو نفر را انتخاب میکنیم و سپس به طور تصادفی عقیده یکی از آنها را برای جمعشان بعد از بحث انتخاب میکنیم. هر کدام از دو عقیده به طور برابر محتمل هستند. فرض کنید برای انتخاب یکی از عقاید به طور تصادفی یک سکه پرتاب میکنیم. اگر دو نفر قبل از بحث عقیده یکسانی داشته باشند همچنان میتوانیم آنها را انتخاب کنیم که با یکدیگر در مورد عقیدهشان صحبت کنند. با این حال در این مورد عقیدهشان یکسان باقی میماند. این قانون به روز رسانی بحثی را که در آن یک نفر میتواند عقیده دیگری را در مورد رنگ مورد علاقهاش تغییر دهد شبیهسازی میکند. این قانون به روز رسانی ساده جزئیات زیادی در مورد کنش روزمره انسانها با یکدیگر به ما نمیدهد. به طور مثال این قانون به روز رسانی شامل هیچ خاطرهای از بحثهای گذشته نیست. با این حال با وجود ماهیت ساده لوحانه این قانون همچنان به محققان برای بررسی تغییرات عقاید در طول زمان کمک میکند.
در شکل اول ارتباط مدل رای دهنده با مثال ما از دوستانی که در مورد رنگهای مورد علاقهشان در هنگام ناهار بحث میکنند را میبینیم. وقتی همه با هم در مورد رنگ توافق میکنند به اجماع میرسند. وقتی انسانها به اجماع نمیرسند ما میگوییم که آنها نظرات پراکنده دارند به این معنا که بیش از دو نظر متفاوت وجود دارد. در مدل رای دهنده محققان علاقمندند که بدانند آیا در نهایت مردم به اجماع میرسند یا نه و اگر به اجماع میرسند چه مدت زمانی طول میکشد تا به آن برسند.
شکل ۱ – مدل سازی انتخاب رنگ با استفاده از مدل رای دهنده.
در ابتدا (در زمان t = 0)، هر حیوان آبی یا قرمز را برای رنگ اصلی مدرسه ترجیح می دهد. در زمان t = 1، پرنده و گربه در مورد رنگ مدرسه بحث می کنند و تصمیم می گیرند که آبی را ترجیح دهند. در زمان t = 2، گربه و خوک در مورد رنگ مدرسه بحث می کنند. آنها یک رنگ را ترجیح می دهند، بنابراین نظرات آنها تغییر نمی کند. در زمان t = 3، سگ و گوسفند در مورد رنگ مدرسه بحث می کنند و تصمیم می گیرند که قرمز را ترجیح می دهند. به روز رسانی نظرات تا زمانی که حیوانات به اجماع برسند ادامه می یابد. در این مثال، در زمان t = 20، همه آبی را ترجیح می دهند.
ادغام شبکههای اجتماعی در مدلهای عقیده
در مثال رنگ مدرسهای که زدیم گروه کوچکی از دوستان در مورد رنگ ترجیحیشان دو به دو بحث میکنند. فرض کنید که این بحثها در مدرسه بزرگی که همه دانش آموزان یکدیگر را نمیشناسند رخ میدهند. محققان میتوانند مجموعه روابط اجتماعی داخل مدرسه را با شبکه اجتماعی از دانش آموزان نشان دهند. دانش آموزان راسهای این شبکه اجتماعی هستند و روابط اجتماعی که دانش آموزان را به هم متصل میکنند را با یالها نشان میدهیم. اگر دو نفر با هم رابطه اجتماعی داشته باشند در اصطلاح به آنها همسایه در شبکه میگوییم. در مثال ما اگر دو راس با هم دوست باشند بین آنها یال وجود دارد. وقتی محققان یک مدل رای دهنده را روی یک شبکه اجتماعی بررسی میکنند تنها راسهای همسایه میتوانند روی عقیده یکدیگر تاثیر بگذارند. یعنی آنها فرض میکنند که فقط افراد دارای یک رابطه اجتماعی میتوانند مستقیماً روی یکدیگر تاثیر بگذارند. به عنوان مثال دانش آموزان یک مدرسه تمایل دارند روی دوستان خود تاثیر بگذارد. استفاده از شبکههای اجتماعی به محققان امکان مطالعه تاثیر ساختار شبکه( یعنی چه کسی با چه کسی دوست است) بر روی تغییر عقاید را میدهد.
یک شبکه اجتماعی دوستی بین دانش آموزان یک مدرسه را در نظر بگیرید. اجازه دهید مدل رای دهنده را روی این شبکه اجتماعی بررسی کنیم. همانند قبل هر دانش آموز در ابتدا قرمز یا آبی را ترجیح میدهد با این حال برخلاف مثال اولیه ما که بدون شبکه اجتماعی بود برخی افراد با یکدیگر دوست نیستند. دو نفر تنها در صورتی با یکدیگر در مورد ترجیحات خود صحبت میکنند که با هم دوست باشند در هر به روز رسانی مدل ما به طور تصادفی یک جفت دوست را برای صحبت با یکدیگر انتخاب میکنیم. یعنی در شبکه اجتماعی دانش آموزان همسایگان را انتخاب میکنیم. سپس به طور تصادفی یکی از نظرات آنها را انتخاب میکنیم و فرض میکنیم که هر دو دانش آموز پس از بحث با این نظر موافق باشند. همانند قبل این به روز رسانی نشان دهنده آن است که یک نفر دوست خود را متقاعد میکند که همان رنگی را ترجیح دهد که او ترجیح میدهد. در شکل دو نمونهای از نحوه به روز رسانی مدل رای دهنده را در یک شبکه اجتماعی بسیار کوچک مشاهده میکنید. نظرات با گذشت زمان تغییر میکنند و در نهایت هر دانشآموز موافقت میکند که به همان یک رنگ رای دهد. یعنی دانش آموزان در نهایت به اجماع میرسند. متاسفانه در زندگی واقعی ممکن است زمان زیادی طول بکشد تا به یک اجماع برسیم. یک مدرسه ممکن است برای تصمیم گیری در مورد رنگ انقدر صبر نکند. برای بررسی موقعیتهای از این دست محققان بررسی میکنند که چگونه نظرات در یک مدل رای دهنده در طول زمان مشخصی مانند یک هفته تغییر میکنند تا ببینند که آیا اجماع حاصل میشود یا خیر. محققین همچنین بررسی میکنند که چه مدت زمانی طول میکشد تا یک اجماع در شبکه ظهور کند.
شکل ۲ – نمونه ای از نحوه به روز رسانی نظرات در مدل رأی دهنده در یک شبکه اجتماعی.
افراد (راسها) دایره های توپر و دوستیها (یالها) خطوط سیاهی است که راسها را به هم متصل می کند. راسها را با نظر آنها (آبی یا قرمز) رنگ می کنیم. در زمان t = 0، ما شبکه اجتماعی و نظرات اولیه همه را نشان می دهیم. برخلاف شکل ۱، فقط دوستان (یعنی راسهای همسایه) می توانند تعامل داشته باشند. برخی از مردم با یکدیگر دوست هستند، اما برخی دیگر دوست نیستند. در هر زمان، ما به صورت تصادفی دو دوست را برای تعامل و به روز رسانی نظرات آنها انتخاب میکنیم.
هنگام مطالعه یک مدل رای دهنده یک انتخاب ممکن آن است که به طور تصادفی نظرات اولیه گروه را تعیین کنیم با این حال در مثال ما ترجیحات اولیه رنگ احتمالاً از یک فرایند تصادفی مانند پرتاب سکه ناشی نمیشوند. بسیاری از مردم رنگ خاصی را ترجیح میدهند و رنگهای دیگر را دوست ندارد. این ترجیحات ممکن است به دلایل زیادی ایجاد شود. شاید کسی اغلب یک لباس آبی میپوشد و یا شاید تیم مورد علاقهای به رنگ آبی دارد. همچنین ممکن است فردی بخواهد از رنگی که با رنگ تیم ورزشی رقیب همخوانی دارد اجتناب کند در یک شبکه اجتماعی مدرسه جوامعی از افراد با دوستیهای زیادی در داخل جامعه وجود دارد. به عنوان مثال جوامع دوستی میتوانند از کلاسها باشگاههای مدرسه یا تیمهای ورزشی ایجاد شوند. احتمال دوستی افرادی که در یک جمع مشخص قرار دارند بیشتر از احتمال دوستی افراد از جمع های مختلف است. همانطور که در شکل سوم مشاهده میکنید محققان میتوانند نظرات اولیه را بر اساس چنین جوامعی انتخاب کنند. به طور مثال فرض کنید رنگ تیم فوتبال محلی آبی است. شاید دانش آموزان کلاس هفتم بیشتر از دانش آموزان کلاس هشتم طرفدار این تیم باشند بنابراین شاید دانش آموزان کلاس هفتم بیشتر از کلاس هشتم آبی را به عنوان رنگ اصلی مدرسه ترجیح دهند. محققان بررسی میکنند که چگونه جوامع شبکههای اجتماعی بر نتایج مدلهای رای دهنده و به طور کلیتر چگونه بر نظرات مردم تاثیر میگذارند.
شکل ۳ – تعیین تصادفی راسهایی که با هم تعامل دارند می تواند به نتایج متفاوتی منجر شود.
یک شبکه اجتماعی با دو جامعه – دانش آموزان کلاس هفتم و کلاس هشتم – را در نظر بگیرید که به ترتیب آبی و قرمز را ترجیح می دهند. (الف) در زمان t = 0، ما انتخاب می کنیم که هر دانش آموز کدام رنگ را ترجیح می دهد. با استفاده از همین اولویتهای اولیه، مدل رأیدهنده را بارها در کامپیوتر شبیهسازی میکنیم. (ب) در یک شبیه سازی، دانش آموزان در نهایت رنگ آبی را ترجیح می دهند. (ث) در شبیه سازی دیگری، دانش آموزان در نهایت رنگ قرمز را ترجیح می دهند. (د) در شبیهسازی دیگر، دو جامعه هنوز ترجیحات متفاوتی در زمان t = 15 دارند. ما این شبیهسازی را تا زمانی ادامه میدهیم که همه دانشآموزان به یک اجماع برسند.
مدلهای عقیده اغلب شامل تصادفی بودن هستند. در مدل رای دهنده این تصادفی بودن در انتخاب نظرات اولیه، تعیین اینکه کدام جفت از افراد برای مکالمه با یکدیگر انتخاب شوند و تعیین اینکه نظر کدام یک از دو نفر به عنوان نظر جمعشان انتخاب میشود ظاهر میشود. در شکل سه میبینید که تصادفی بودن میتواند باعث شود که از یک مدل ریاضی نتایج کاملا متفاوتی حاصل شود. محققان باید هنگام تعیین اینکه آیا تفاوت در نتایج مدل ناشی از ویژگیهای شبکه اجتماعی است مانند جوامع داخل شبکه یا از تصادفی بودن حاصل شده است دقت به خرج دهند. آنها اغلب از شبیه سازیهای کامپیوتری برای مطالعه مدلهای عقیده استفاده میکنند و مهم است که یک مدل مانند مدل رای دهنده را بارها شبیه سازی کنیم تا نتایج احتمالی آن را به دقت بررسی کنیم.
از مدل رای دهنده چه میتوانیم بیاموزیم؟
چرا محققان به مدلهای رای دهنده و سایر مدلهای نظری علاقمند هستند؟ تصمیم گیری در مورد رنگ جدید مدرسه ممکن است چندان مهم به نظر نرسد با این حال مطالعه مدلهای عقیده میتواند به محققان کمک کند تا تغییرات در افکار عمومی در مورد موضوعات مهمی مانند انتخابات ریاست جمهوری و سیاستهای واکسیناسیون را بررسی کنند. مدلهای عقیده میتوانند بینشهایی در مورد چگونگی اشاعه اطلاعات دقیق و اینکه چگونه استفاده از رسانههای اجتماعی میتواند بر دیدگاههای ما تاثیر بگذارد ارائه دهد. رسانههای اجتماعی نحوه تعامل مردم و نحوه انتشار نظرات را تغییر دادهاند. به طور مثال رسانههای اجتماعی بر دیدگاه مردم در مورد کووید ۱۹ تاثیر گذاشتند. رسانههای اجتماعی میتوانند به مقامات بهداشتی کمک کنند تا راهنماییهای مهمی مانند اطلاعات در مورد واکسنها را به اشتراک بگذارند. از طرف دیگر متاسفانه رسانههای اجتماعی میتوانند به انتشار اطلاعات نادرست و گمراه کننده کمک کنند که میتواند به سلامت روحی و جسمی بسیاری از افراد آسیب برساند.
محققان در بسیاری از موضوعات از جمله ریاضیات، روانشناسی، جامعه شناسی، زیست شناسی، فیزیک، اقتصاد، علوم کامپیوتر و غیره به دلایل مختلف مدلهای عقیده را مطالعه میکنند. ریاضیدانان و فیزیکدانان اغلب این مدلها را به دلیل جالب بودن مطالعه میکنند. دانشمندان علوم سیاسی از مدلهای عقیده برای مطالعه قطبی شدن نتایج رای گیری در انتخابات استفاده میکنند. در تجارت مدلهای عقیده برای مطالعه تصمیمهای قیمت گذاری در بازارهای مالی، بررسی محصول در فروش آنلاین و اثرات کمپینهای تبلیغاتی مورد استفاده قرار گرفتهاند. محققان همچنین چگونگی اثر متقابل تغییر عقاید و پخش بیماریها را با مدلهای ترکیبی بررسی کردهاند.
مدلهای رای دهنده کاربردهای زیادی دارند و ما میتوانیم با واقع بینانهتر کردن آنها بهره بیشتری از آنها ببریم. چگونه میتوانیم مدلهای رای دهنده را واقع بینانهتر کنیم؟ در یک مدل رای دهنده ما به طور تصادفی تعیین میکنیم که پس از تعامل دو نفر کدام نظر را به عنوان نظر مشترکشان انتخاب کنند. با این حال در واقعیت دقیقاً مشخص نیست که مردم چگونه نظرات خود را شکل میدهند و چگونه آنها را تغییر میدهند. همچنین نظرات مردم با فاکتورهای دیگری به غیر از تاثیر مستقیم افراد شکل میگیرند. تشکیل و تغییر عقاید فرایند پیچیدهای است بنابراین مدل سازی ریاضی در مورد آن دشوار است. قانون به روز رسانی مدل رای دهنده واقعیت را بیش از حد ساده میکند بنابراین محققان سعی کردهاند که این به روز رسانی را به واقعیت نزدیکتر کنند. همچنین محققان انواع دیگری از مدلهای عقیده را توسعه دادهاند مانند مدلهایی که شامل افراد سرسختی میشوند که بعید است نظرات خود را تغییر دهند، تا ایدههای مختلفی را در مورد چگونگی تغییر نظرات افراد در خود بگنجانند. آنها همچنین مدلهای عقیدهای را توسعه دادهاند که مفاهیمی همچون فشار همگروهیان را در بر میگیرد. به عنوان مثال شاید برخی از افراد فقط نظر خود را به نظری تغییر دهند که به اندازه کافی در بین دوستانشان محبوب باشد مثلاً زمانی که حداقل ۵ نفر از دوستانشان این نظر را داشته باشند. محققان همچنین مدلهای عقیدهای را بررسی میکنند که در آنها ساختار شبکهی اجتماعی و تغییر نظرات به یکدیگر وابسته هستند . به عنوان مثال اگر شما با کسی در مورد موضوع مهمی تفاوت شدید عقیده دارید ممکن است او را در اینستاگرام یا تیک تاک دنبال نکنید.
خلاصه و از اینجا به کجا میرویم؟
مطالعه اینکه چگونه تعاملات اجتماعی بین افراد بر نظرات آنها تاثیر میگذارد روشی جذاب برای استفاده از ریاضیات است. محققان مدلهای نظری جدیدی را برای توسعه بینش در مورد تعاملات انسانی و تاثیرات آن بر پدیدههای اجتماعی ایجاد میکنند. این مدلها بسیار سادهتر از تغییر عقاید در واقعیت هستند. چالش اصلی در مدل سازی عقاید ارزیابی مدلها از طریق مقایسه آنها با نظرات موجود در دادههای دنیای واقعی است. محققان فعالانه در تلاشند تا راههای مناسبی برای انجام این کار پیدا کنند. با این حال و با وجود چالشها مدلهای عقیده همچنان به محققان کمک میکنند تا بیاموزند که چگونه تعاملات اجتماعی بر نظرات ما تاثیر میگذارند. همانگونه که محققان مدلهای عقاید بیشتری را توسعه میدهند ما در مورد چگونگی تغییر عقاید و تاثیر این تغییرات بر رفتار انسان بیشتر میآموزیم.
برای دیدن منابع و جزئیات بیشتر به اصل نوشته حتما نگاه کنید.
این میم بهونه خوبیه که در مورد روشهای متفاوتی که میشه مکانیک کلاسیک رو ارائه کرد حرف زد. پس توی این نوشته، بدون پرداختن به مکانیک کوانتومی، سراغ فرمول بندیهای مدرنی میریم که برای توصیف حرکت داریم.
صورتبندی نیوتون
نخستین فرمول بندی همانچیزی است که همه ما در مدرسه با آن آشنا شدهایم؛ صورتبندی نیوتون. نیوتون با ارائه سه قانون، چارچوبی کلی برای مطالعه حرکت معرفی کرد. با پذیرفتن این سه قانون، میشود حرکت ذرات غبار در هوا یا حرکت سیارات و کهکشانها را با دقت خوبی توضیح داد و پیش بینی کرد. به طور خلاصه به کمک قوانین نیوتون میتوانیم بگوییم زمین چگونه به دور خورشید میچرخد و اگر توپی را با فلان سرعت پرتاپ کنیم، کی به کجا میرسد.
قانون اول نیوتون در مورد ناظر است. این قانون میگوید برای داشتن درک درستی از حرکت اجسام، کسی که آنها را مشاهده میکند هم مهم است. در واقع نیوتون قوانین حرکتش را برای ناظرهایی ارائه میدهد که در ابتدای امر تکلیف آنها را مشخص کرده: ناظرهای لَخت. تعریف ساده ناظر لخت این گونه است: اگر جسمی را منزوی کنیم جوری که هیچ جسم دیگری روی آن اثری نگذارد، آن موقع، ناظر مورد نظر ما آنی است که ببیند جسم با سرعت ثابتی حرکت میکند. قاعدتا سرعت صفر(بیحرکتی) هم شامل این مورد میشود. بعد از مرور قانون دوم دوباره به این قانون فکر کنید. قانون اول از قانون دوم نتیجه نمیشود!
به دنبال قانون اول، قانون دوم نیوتون شیوه ترجمه اثرات خارجی وارد بر یک جسم به تغییرات سرعت آن را توضیح میدهد. بیان ریاضی این قانون معادلهی دیفرانسیل مرتبه دویی است که در یک طرف آن تغییرات تکانه جسم و طرف دیگر آن همه اطلاعات مربوط به اثرات خارجی را در قالب کمیت برداری به اسم نیرو قرار میدهد. دراینجا، تکانه جسم، حاصلضرب کمیتی ذاتی به اسم جرم جسم در سرعت آن است. جرم جسم $m$ در این قانون، پارامتری است که آهنگ تغییرات سرعت جسم $\dot{\textbf{v}}$ به واسطه نیروهای وارد شده به آن یعنی $\textbf{F}$ را کنترل میکند.
$$\textbf{F} = m \frac{d^2\textbf{x}}{dt^2} = m\dot{\textbf{v}}$$
در فیزیک رسم است که مشتق زمانی یک کمیت را با گذاشتن یک نقطه بالای آن نشان میدهیم. اینکه چرا قانون دوم توسط یک معادله دیفرانسیل مرتبه دو توصیف میشود، چیزی است که طبیعت انتخاب کرده. با این وجود این انتخاب برای ما تا حدودی خوشایند است. از لحاظ ریاضی تفسیر این معادله این است که اگر ما بدانیم بر جسمی چه نیروهایی وارد میشود و سرعت و مکان آن را در هر لحظه بدانیم، دیگر نیازی نیست اطلاعات بیشتری داشته باشیم تا حرکت آن جسم را توصیف کنیم. یعنی مکان و سرعت در یک لحظه تمام اطلاعات اولیهای است که به آنها نیاز داریم و بقیه اطلاعات دیگر را میتوانیم حساب کنیم. زیباست. نه؟!
قانون سوم نیوتون را به شیوههای مختلفی میشود بیان کرد که حتما در مورد آن شنیدهاید. آنچه که برایتان شاید جالب باشد این است که این قانون کامل نیست. منظور از کامل نبودن این است که در بعضی مسائل به تنهایی توصیف درستی ارائه نمیکند. چرا و چگونهاش بماند برای بعد. چیزی که الان مهم است این است که به واسطه قانون سوم نیوتون میشود روشی برای مقایسه و اندازه گیری جرم اجسام گوناگون پیدا کرد. پس به لطف این قانون، تکلیف جرم جسم مشخص میشود. حالا کافی است که نیروها را مشخص کنیم. آنموقع به واسطه قانون دوم میتوانیم حرکت یک جسم را توصیف کنیم. مشکل اینجاست که قوانین نیوتون به تنهایی این کار را برای ما انجام نمیدهند. یعنی در کنار این سه قانون، باید صورتبندیهایی برای نیروهای مختلف هم پیدا کنیم. خوشبختانه به نظر میرسد که تعداد نیروهای بنیادی از شمار انگشتان یک دست کمترند. در زندگی روزمره ما، نظریههای گرانش و الکترومغناطیس تقریبا همه نیروهای وارد بر اجسام را توصیف میکنند. به طور خلاصه، هر بار که چیزی میافتد به خاطر گرانش است و هر چیز دیگر تقریبا منشا الکترومغناطیس دارد از جمله بالا بردن اجسام توسط بازوی ما یا آسانسور منزل!
حالا ما میتوانیم طبیعت را توصیف کنیم. یا دست کم حرکت در طبیعت را تا وقتی که اثرات کوانتومی یا نسبیتی وارد نشدهاند را با دقت خوبی توضیح دهیم.
اما این فقط یک روایت از طبیعت است. ما میتوانیم این داستان را جور دیگری هم بیان کنیم. یعنی میشود حرکت اجسام را جور دیگری هم صورتبندی کرد بدون اینکه با صورتبندی نیوتون ناسازگار از آب درآیند. صورتبندیهایی که همین حرفها را با ریاضیات متفاوتی بیان کنند و چه بسا قدرت عمل بیشتری به ما در محاسبات و تعمیم ایدهها — فرای مکانیک استاندارد — هم دهند.
آرامگاه نیوتون در کلیسای وستمینستر لندن
اصل کمترین کنش و روش لاگرانژ و همیلتون
فرض کنید شما سامانهای را در یک لحظه میبینید. سپس چشمانتان را برای مدت کوتاهی میبندید، دوباره باز میکنید و در لحظه جدید سامانه را در موقعیت جدیدش مشاهده میکنید. برای مثال، توپی را تصور کنید که در لحظه اول در نقطه پنالتی و در لحظه بعدی در کنج دروازه جا گرفته. حالا تمام مسیرهایی که توپ ممکن است بین این دو لحظه طی کرده باشد را تصور کنید. مثلا یک مسیر این است که توپ مستقیم از نقطه پنالتی به کنج دروازه رفته باشد. یک مسیر ممکن دیگر این است که توپ روی منحنی هیجانانگیزتری حرکت کرده و به کنج دروازه نشسته. یک مسیر هم میتواند این باشد که توپ به هوا رفته، چرخیده و دست آخر برگشته و وارد دروازه شده. حالا فرض کنید، به هر کدام از این مسیرها کمیتی نسبت میدهیم به نام کُنِش و ما کنش همه مسیرها را در جدولی یادداشت میکنیم.
هیچکس تا به حال ندیده که ضربه پنالتی به عقب برود و سپس به درواز برگردد. منطقی نیست. یا به عبارتی این مسیری نیست که طبیعت اجازه طی شدنش را بدهد وقتی شخصی به سمت دروازه ضربه میزند. پس قرارداد میکنیم که مسیری مجاز است که توسط طبیعت انتخاب شود و طبیعت مسیری را انتخاب میکند که کمترین (اکسترمم) کنش را داشته باشد. به این قاعده، اصل کمترین کنش یا اصل همیلتون میگویند. در عمل، همانطور که برای پیدا کردن نقاط اکسترمم توابع مشتق پذیر، به دنبال ریشههای مشتق آن تابع میگردیم، اینجا هم ایدههایی مشابه وجود دارد که نیاز نباشد همه مسیرها را امتحان کنیم. حالا فرض کنید که مسیری که کمترین کنش را دارد را پیدا کردهایم. پس اگر اندکی آنرا تغییر دهیم نباید کنش مسئله تغییر چشمگیری کند. درست همانطور که مثلا تابع $y = x^2$ در نقطه صفر که کمینه آن است تغییر چندانی نمیکند.
کنش $S$ را به صورت ریاضی میتوانیم به صورت انتگرال زمانی تابع دیگری به نام $L$ بنویسم. چرا؟ چون این کَلک خوبی است که در ادامه از آن لذت خواهیم برد! اسم انتگرالده را هم به احترام آقای لاگرانژ و زحماتی که برای این صورتبندی پیشتر از خیلیها انجام داده لاگرانژی میگذاریم. لاگرانژی تابعی از مکان، سرعت و احیانا زمان است. کلا بنا را هم بر این بگذارید که داریم بازی ریاضی میکنیم با این ایده که گویی لاگرانژی اطلاعات مربوط به ویژگی های ذاتی جسم و برهمکنشهای آن با دیگر ذرات و موجودات دیگر را دارد و ما میخواهیم همه این اطلاعات بین دو زمان مشخص را به کنش نسبت دهیم. پس مینویسیم
$$S = \int^{t_2}_{t_1} L(q , \dot q, t) \, dt. $$
تا اینجا هیچ کار عجیبی نکردهایم. فرض کردهایم چیزی وجود دارد به اسم کنش که به صورت یک انتگرال تعریف میشود. همینطور از مختصات تعمیم یافته $q$ و $\dot q$ برای نشان دادن مکان و سرعت استفاده کردهایم گویی میخواهیم از مختصه جدیدی به جای مثلا $x$ استفاده کنیم.
حالا میخواهیم ببینیم مسیر بهینه که اسمش را میگذاریم $q_{c(t)}$ چگونه به دست میآید. طبق چیزی که تعریف کردهایم، مسیر بهینه باید کنش را کمینه (یا به عبارت فنیتر اکسترمم) کند. پس تحت تغییرات بینهایت کوچک مسیر، کنش متناظرش نباید تغییر خاصی کند. درست مانند وقتی که مشتق توابع پیوسته — که نشاندهنده تغییرات آن توابع هستند — در نقاط بیشینه یا کمینهشان صفر هستند. پس بیاید تغییرات کنش را حساب کنیم و برابر با صفر قرار دهیم
جمله ی آخر صفر است چون که ابتدا و انتهای مسیر را ثابت کردهایم. البته میشد این انتخاب را انجام نداد و از جملات مرزی در مواردی استفاده کرد. اما برای این نوشته همین قدر جزئیات کافی است. از آن جا که $\delta q_{(t)}$ تغییراتی دلخواه است و برای مثال میتواند فقط در زمان دلخواه $t$ غیر صفر (تقریبا و با اغماض شبیه دلتای دیراک) باشد، انتگرالدهمان باید در هر لحظه صفر باشد. پس کمینه کردن کنش، $\delta S =0$، نتیجه میدهد
این معادله همان چیزی است که بالای سر مرد عنکبوتی وسطی ابتدای این نوشته قرار دارد و در جامعه فیزیک مشهور است به معادله اویلر–لاگرانژ. این معادله معادلات حرکت را نتیجه میدهد. درست مانند قانون دوم نیوتون.
ولی لاگرانژی واقعا چیست؟ این سوال کمابیش در زبان نیوتونی مثل آن است که بپرسیم چه نیروهایی بر جسم وارد میشوند. برای پاسخ به این پرسش نیاز به شناخت سیستم و برهمکنشهای آن داریم. مثلا برای ذرهای که در حال حرکت تحت یک پتانسیل است، لاگرانژی این سیستم برابر با با اختلاف انرژی جنبشی و پتانسیل آن ذره است. توجه کنید که لاگرانژی کمیتی نردهای است، برخلاف نیرو که کمیتی برداری است. از لحاظ ریاضی کار کردن با کمیتهای نردهای خیلی راحتتر است. این اولین حسن صورتبندی جدید است. همین طور توجه کنید که از لحاظ ابعادی، لاگرانژی بعد انرژی دارد. نکته دیگری که بد نیست بدانید این است که خیلی از اوقات لاگرانژی را بنا بر یک سری تقاضاهای فیزیکی مانند تقارن های حاکم بر سیستم حدس میزنیم. برای دیدن چند مثال در این مورد به این نوشته نگاه کنید: تقارن،قوانین پایستگی و اِمی نٌودِر.
این ویدیو سیر تاریخی این مسئله را به خوبی نشان میدهد:
منتظر ادامه این نوشته باشید.
اما اگر عجله دارید، این ویدیوها و این کتاب را نگاه کنید:
ویراستار: متن پیش رو نخستین بار توسط این نویسنده در سی و سومین شمارهی تکانه (نشریه علمی-آموزشی دانشجویان فیزیک دانشگاه صنعتی شریف) آمده. نویسنده از آقای علی گودرزی، آقای دکتر سامان مقیمی، آقای حسین مهدئی و آقای امیرحسین پیلهوریان و همچنین خانم حانیه ملکی تشکر میکند.
برای درک بهتر این نوشته، سیتپور شنیدن این پادکست را پیشنهاد میکند:
فروکاستگرایی یا تقلیلگرایی باوری فلسفی است که همهی قوانین حاکم بر طبیعت را میتوان با تعداد کمی از «قوانین بنیادی» توصیف کرد. بهعنوان مثال، این باور احتمالا رایج که رفتار یک سامانه دارای تعداد زیادی «ذره» (بهعنوان مثال جعبهای شامل تعداد زیادی مولکول گاز یا رفتارهای موجودی زنده که از تعداد زیادی مولکول تشکیل شده است) را می توان از طریق برآیند رفتار تکتک ذرات توصیف کرد، که البته حقیقت بدیهیای به نظر نمیآید، از این باور فلسفی نشأت میگیرد. مثلا بیوفیزیکدانان در مقیاس «بنیادیتری» نسبت به زیستشناسان کار میکنند و تلاش میکنند برخی رفتارهای موجودات زنده را از طریق فیزیک حاکم بر مولکولها و مواردی از این قبیل توصیف کنند. در این مقاله به طور خاص به فروکاستگرایی در فیزیک و بخشی از تأثیر آن در روند پیشرفت علم فیزیک میپردازیم.
از نظر تاریخی احتمالا این باور از حدود زمان گالیله و نیوتن به طور جدیتر وارد فیزیک شده است. شاید معروفترین شاهد آن تلاش نیوتن برای نوشتن قانون گرانش باشد؛ او سعی کرد به قانونی برسد که تمام برهمکنشهای گرانشی را توضیح دهد. تلاش او در این راستا بود که حرکت سیارات، سقوط اجسام بر روی زمین و مواردی از این دست را بتواند با یک قانون واحد توضیح دهد. یک نکتهی قابل بحث این است که به نظر نمیآید الزامی برای «وجود» قانونی واحد باشد که همهی برهمکنشهای گرانشی را توضیح دهد. به نظر میآید از نظر تاریخی، در ادامه و بعد از زمان گالیله و نیوتن این نگرش به مرور بیشتر وارد فیزیک شده است. چند الگوی جالب و مشخصتر در برخی اتفاقات پررنگ مربوط به این دیدگاه در علم فیزیک مشاهده میشود که به آنها خواهیم پرداخت (هر چند که این دستهبندی شامل همه الگوها نمیشود و لزوما یکتا نیست).
نظریه موثر
زیاد پیش میآید که در فیزیک، نظریهی توجیه کنندهای پدیدهای — که با مشاهدات تعارض خاصی ندارد — را به عنوان نظریهی موثر یک نظریهی بنیادیتر بنویسند. یکی از معروفترین تلاشها در این راستا ساختن مکانیک آماری است، که کل نظریهی ترمودینامیک را به مکانیک بس ذرهای تقلیل میهد و تلاش میکند با روشهای آماری، ترمودینامیک را به عنوان نظریهی موثری از مکانیک نیوتنی و بعد از آن مکانیک کوانتومی بسازد. هر گاه بین نظریهی به نسبت پذیرفته شده موجود و مشاهدات (تجربه) تعارضاتی مشاهده شود، فیزیکدانها تلاش میکنند تا با رعایت اصل همخوانی، نظریهی جدیدی بسازند؛ به این معنا که نظریهی جدید باید در حالات حدی مشخصی نتایج نظریهی سابق را مجنر شود. مثلا نظریهی نسبیت یا مکانیک کوانتومی که در پی همخوان نبودن مشاهدات تجربی با نظریههای کلاسیک ساخته شدند در حدهایی نتایج مکانیک کلاسیک را بازتولید میکند. به هر حال، نظریه مکانیک کلاسیک کامل نیست ولی در برخی حدود بسیار خوب کار میکند. به قول فاینمن، علم در مورد این نیست که چه چیز درست یا نادرست است، بلکه در مورد این است که ما چه چیز را با چه دقتی میتوانیم توصیف کنیم. مکانیک کلاسیک برای سرعتهای پایین یا اندازههای خاصی در اکثر موارد با دقت خوبی با مشاهدات ما همخوانی دارند. نظریههای پیشرفتهتری چون مکانیک کوانتومی و نسبیت هم در این حدود تبدیل میشوند به مکانیک کلاسیک. گاهی نظریههای جدید برای از بین بردن تعارضات دو نظریه جا افتاده تهیه میشوند. مثلا سوای مشاهدات آزمایش مایکلسون – مورلی، نسبیت خاص به دنبال بهبود نظریه مکانیک کلاسیک برای همخوانی با نتایج نظریه الکترومغناطیس ساخته شد.
پدیدارگی
گاهی در سامانههای بسذرهای ویژگیهای جدیدی اصطلاحا«پدیدار میشوند» بیآنکه ذرات سازنده آن سامانه آن ویژگی یا ویژگیها را در خود داشته باشند. از طرف دیگر، رفتار برخی سامانهها در سطوح مختلف را بدون دانستن سطوح بالاتر یا پایینتر آن میتوان فهمید. پدیدارگی یا پدیدار شدگی به بهوجود آمدن ویژگیهای یک سامانه در سطوح بالاتر پیچیدگی اشاره دارد که در تک تک اجزای آن در سطح پیچیدگی کمتر قابل مشاهده نیست و فقط در برآیند کل سامانه و با در نظر گرفتن کل اجزا و برهمکنشهایشان میتوان آنها را دید. فیلیپ اندرسون در مقالهای با عنوان «بیشتر، متفاوت است» این ایده را مطرح کرد که برای درک برخی از پدیدهها، پرداختن به نظریههای «بنیادیتر» لزوما سودمندتر نیست. مثلا انتظار می رود که علیالاصول کل شیمی را از فیزیک بسذرهای بتوان را استخراج کرد. اندرسون این ایده را مطرح میکند که این نظریههای موثر که در سطوح پیچیدگی بالاتری ساخته میشوند باید (از نظر خودش) به همان اندازه «بنیادی» تلقی شوند که نظریههای با سطح پیچیدگی کمتر تلقی میشوند، چون عملا بسیاری از اوقات «بنیادیترین» چیزی هستند که با آن میتوان مشاهدات را توصیف کرد. اندرسون از این دیدگاه انتقاد میکند که گاهی تنها به فیزیکدانان ذرات بنیادی به عنوان کسانی که کار «بنیادی» میکنند نگاه میشود، اما نظریههای ذرات بنیادی در عمل نمیتوانند بسیاری از پدیدههایی که مشاهده میکنیم و حاصل برهمکنش تعداد زیادی ذره هستند را توصیف کنند.
یکی دیگر از موارد قابل ذکر این است که نظریههای در سطوح پیچیدگی بالاتر خیلی اوقات برگرفته و حاصل تقریباتی از نظریههای بنیادیتر هستند و کاملا بدون اتکا به آنها نیستند. در واقع برای سادهتر شدن مدل و معادلات خیلی از این نوع نظریهها تقریباتی را وارد میکنند و با در نظر گرفتن اصل نظریه بنیادیتر، از بسیاری از پیچیدگیها صرف نظر میکنند. به عنوان مثال میتوان به مدل هابارد در فیزیک ماده چگال اشاره کرد. در این مدل از برهمکنش الکترونهای غیر نزدیک صرف نظر میشود و مقدار پتانسیل حاصل از برهمکنش الکترونهای نزدیک هم به عنوان تابعی از بقیهی پارامترها وارد مدل نمیشود. در این مورد مثلا ایدهی تقریب را میتوان در قانون کولن دید، به دلیل رابطهی عکس پتانسیل با فاصله، از پتانسیل ناشی از الکترونهای در فواصل دور از هم صرفنظر میشود. در سامانههای پیچیده هم از این جنس ایدهها استفاده میشود. فایدهی این کار این است که با اجتناب از درگیر محاسبات گاهی طولانی شدن، میتوان راحتتر به استنتاج نتایج حاصل از مدل پرداخت. البته میزان کارا بودن مدل سادهسازی شده باید با نتایج آزمایشها مطابقت داده شود.
نکتهی دیگری که وجود دارد بحث سودمند بودن یا نبودن توصیف پدیدههای پیچیده توسط نظریههای با سطح پیچیدگی کمتر است. فرض کنید بتوان با کامپیوترهای آینده سامانههای بسذرهای را با نظریههای در سطح اتمها حل عددی کرد. مشکلی که وجود دارد این است که حجم اطلاعات به دست آمده به این صورت بسیار زیاد است و بسیاری از آنها را نمیتوان به طور مستقیم در پدیدههایی که نیاز به توصیفشان را داریم مشاهده کرد. مثلا یک ظرف گاز را در نظر بگیرید. حتی اگر معادلات حرکت حاکم بر تک تک ذرات را بتوانیم به صورت کلاسیک حل کنیم، مشکل بعدی این هست که چیزی که مشاهده میکنیم مکان تک تک ذرات نیست. تابعیت زمان مکان تک تک ذرات برای توصیف یک سامانه ترمودینامیکی کارایی خاصی ندارد. حتی در این حالت هم باید دنبال کمیتهای موثری بگردیم، کمیتهایی که در این سطح از پیچیدگی پدیدار میشوند و سعی کنیم از حل عددی معادلات حرکت همهی ذرات به طریقی به آنها برسیم. در ترمودینامیک کمیتهایی مثل فشار و دما از این جنس هستند.
یکی ازمشکلاتی که گاهی از نظر عملی به تلاش برای توصیف یک سامانه با تعداد کمی پارامتر توسط نظریههای در سطح پیچیدگی بالاتر وارد میشود، این است که این کار بسیار سادهانگاری دارد و همیشه نمیتوان کل سامانه بسذرهای را توسط تعداد کمی کمیت موثر توصیف کرد. دکتر خرمی در مقالهای که در زمینهی فروکاستگرایی نوشتهاند اینطور استدلال میکنند که این نکته نسبتا بدیهی است. میتوان تعداد کمیتهای موثر را بیشتر کرد (و حتی مثلا تمام ذرات گاز را در نظر گرفت) ولی به این قیمت که میزان محاسبات بیشتر شود. وقتی محدودیت توان و انرژی داشته باشیم، این نهایت کاری است که میتوانیم بکنیم. اگر در آینده این محدودیتها کمتر شد، و البته نیاز به دقت بیشتری وجود داشت، میتوان محاسبات را دقیقتر کرد و آنها را با نظریههای با سطح پیچیدگی کمتری پیش برد. مثالی که در مقالهشان به آن اشاره میکنند در مورد هواشناسی است. اینکه در گذشته به دلیل کمقدرتتر بودن کامپیوترها مجبور بودند محاسبات را سادهتر کنند به این قیمت که دقت پیشبینیها کم میشد و همچنین مقیاس زمانیای که پیشبینیها تا آن تا حد معقولی کار میکردند کمتر میشد. ولی این نهایت کاری بود که میتوانستند بکنند و اصطلاحا «از هیچ چیز بهتر بود». اما بعدا با قدرتمندتر شدن کامپیوترها و ابزارهای محاسبه پیشبینیها بهتر شدند و تا مقیاس زمانی بزرگتری قابل اتکا بودند.