Замечание о каноническом распределении
Автор: Зорич Владимир Антонович
Журнал: Математическая физика и компьютерное моделирование @mpcm-jvolsu
Рубрика: Математика
Статья в выпуске: 3 (22), 2014 года.
Бесплатный доступ
Каноническое распределение Гиббса широко используется в статистической термодинамике. Его формальному обоснованию (исходя из некоторых фундаментальных или представляющихся более простыми принципов и положений) посвящено много серьезных работ. Мы здесь остановимся на одной геометрической модели, которая в привычных для термодинамики предположениях тоже ведет к распределению Гиббса.
Короткий адрес: https://sciup.org/14968749
IDR: 14968749 | УДК: 517+514+519.2
A remark on the canonical distribution
It is а well-known fact that if we take the ??-dimensional ball of unit volume and project it orthogonally onto a straight line, observing how the measure is distributed on the projection, then in the limit as ?? > ? we get the normal distribution on the line. It is also well known that almost the entire volume of the multidimensional domain, for example, of the multidimensional ball, is concentrated in the neighborhood of the boundary. These phenomena have numerous manifestations and consequences. For example, any more or less regular function on the multidimensional ball or on the multidimensional sphere is practically constant from the point of view of the observer who takes two random points of the domain of the function and compares the values of the function at these points. Classical Maxwell and Gibbs distributions of thermodynamics are discussed here in the context of multidimensional geometry.
Текст научной статьи Замечание о каноническом распределении
1. Газ, многомерная сфера и малая часть большой системы
Рассмотрим однородный газ в какой-то покоящейся емкости. Пусть v 1 , ...,v n — трехмерные векторы скорости молекул. В стандартных условиях естественно считать, что совокупная кинетическая энергия Е п = S ” =1| mv 2 молекул пропорциональна их количеству п, то есть Е п = Еп и ©' 1 v 2 = 2^ п. Последнее соотношение определяет сферу радиуса 2^ п в пространстве R 3 ” . Пусть это будет пояснением к физической интерпретации следующих геометрических рассмотрений.
В п-мерном евклидовом пространстве R ” рассмотрим сферу S ” 1 (г) радиуса г = = а^/п с центром в начале координат, заданную уравнением
2 , , 2 2
ж 1 + ... + ж га = а п.
Эту сферу S ” -1© ) спроектируем ортогонально на прямую, проходящую через ее центр, например, на какую-то (пусть первую) координатную ось. Получится отрезок [ - г,г]. Фиксируем отрезок [а,Ь] С [ - г,г]. Пусть S[а,Ь] — площадь той части S ”— (г) сферы S ” -1 (г), которая проектируется в отрезок [а, Ь]. Подсчитав отношение J—^] , то есть вероятность Рг „ [а,Ь] того, что случайно выбранная точка сферы окажется в слое S^ (г) над отрезком [а, Ь] (полагая, что точки распределены по сфере равномерно), найдем, что
Pr n [a, 6] =
J C (1 - ( x/r ) 2 ) 2 dec J!T (1 - (x/r) 2 ) " - 3 dx
Вспоминая, что в интересной для термодинамики ситуации r = стл/п, а п ^ 1, переходя к пределу при п ^ то , приходим к классическому нормальному закону распределения вероятностей
Pr n [a < x < b] ^
1 \ 2 xct
/ е " 2 dx.
J Ct
Мы получили ра с пределение вероятностей значений одной координаты случайной точки сферы Sn-1(a^n) C R ” при п » 1.
При термодинамической интерпретации мы в (3) фактически имеем (с точностью до естественных переобозначений и преобразований) закон распределения координат скорости (а тем самым и энергии) одной частицы в огромной системе, энергию которой можно считать бесконечно большой.
Каноническое распределение Гиббса, вообще говоря, относится к любой малой части очень большой системы, находящейся в термодинамическом равновесии. Именно в этом его универсальность.
Если бы мы следили не за одной частицей, а за порцией из любого конечного числа частиц, то, спроектировав сферу на координатное подпространство, отвечающее этим частицам, мы, конечно, получили бы снова нормальное распределение, но в пространстве соответствующей размерности. Впрочем, это следует уже из полученного результата с учетом предполагаемой независимости частиц.
вероятности величины х =
Пусть Р — плотность распределения вероятностей случайного вектора x = (х 1 ,...,х п ) в пространстве R n . Считая, что координаты вектора распределены соответственно с плотностями p i и независимы, имеем
Р(хъ ...,хп) = pi(^i) •... • Pn(хn), а если, к тому же, в пространстве нет привилегированных направлений, то Р зависит только от модуля х = |x| вектора или, например, от его скалярного квадрата х2 = x2, a p1 = ... = pn = p. Позволив себе небольшую вольность, сохраним то же обозначение Р для функции Р(х2) от х2, заменив ею Р(х1, ...,хп).
Дифференцируя равенство
1одР (х 2 ) = log p(х 1 ) + ... + log p(х п )
по каждой из переменных х 1 ,...,х п последовательно (после очевидных арифметических преобразований), получаем
2 Р ' (х 2 ) = p' (х 1 ) = = p' (х п )
Р (х 2 ) X 1 P(X 1 ) ... X п P(X п )
где а — постоянная (ввиду равенства функций от разных независимых переменных).
Решая уравнения ^^ = ах » , находим, что p(х i ) = Ле 5 .
Из равенства J +” p(х i )dх i = 1, нормирующего полную вероятность, вычислив ин- ^^2
теграл J+” Ле-dх = Ла /^д/^ = 1, получаем связь Л = ^|^, то есть p(хi) = ш2
—е 2^ е
.
Задание, например, второго момента
Z +”
х^p(х i )dх i = ст2,
а
∞ после вычисления интеграла
+”
J”Чт/ 2 5 = Vs(-2) 55 L е 2 *
полностью определит (уже знакомую нам из формулы (3)) функцию
p(хi) = (У2^ст) 1е 2^2,(5)
и искомую общую функцию
П 11+... + 1^
Р (х 1 ,..., х п ) = (2лст 2 ) 2 е 252 = (2лст 2 ) 2 е 252 .
Напомним, что если случайные величины х, х функционально связаны, то их плотности распределения /, / связаны соотношением /(х)5х = / (х)5х, которое, зная зависимости х = х(х),х = х(х), позволяет находить одну из функций /, / по другой.
Имея функцию (6) плотности распределения вероятностей случайного вектора (х1,...,хп) в пространстве Rn, можно указать функцию /(х) распределения модуля х = ^х1 + ... + х^ этого вектора. Достаточно рассмотреть в пространстве R” сферические координаты и проинтегрировать функцию (6) по сфере соответствующего радиуса х:
х 2
/ (х) = шп_1 х"-1 • (2жг2)-2 е-.2.(7)
Здесь ш п - 1 — площадь, то есть (п — 1)-мера, единичной сферы в пространстве R ” .
Из упомянутого выше общего соотношения /(х) = /(х) h теперь можно получить и функцию F распределения величины х = х 2 — квадрата модуля вектора (х 1 , ...,х „ ) :
П- 1 п х 1
F(х) = шп-1х 2 • (2^а2) 2е • (-х 2).(8)
х " + х " + х " трехмерного вектора скорости молекул
В частности, для модуля х = газа из (7) при п = 3 получаем
3 V 2
/ (х) = 4^х 2 • (2^а 2 ) 2 е 2 ^ 2 .
Переходя к кинетической энергии Е = | тх 2 отсюда (или из (8) при п = 3 и Е = = | тх), получаем плотность распределения вероятностей значений энергии случайной молекулы газа
2Е _ 3 _ 2Е 1 / 2 [
F < Е ) =- • ■) _ 2е ^ • 2 V тЕ = 2у
Е
Е
---------- е тХ 2 .
^(та 2 )
Для того чтобы последние формулы приобрели достаточно законченный с точки зрения физики вид, необходимо раскрыть физический смысл параметра а или произведения та 2 .
Применительно к рассматриваемой ситуации идеального газа формула (5), определяющая а 2 , показывает, что а 2 в нашем случае есть среднее значение (математическое ожидание) квадрата компоненты (координаты) трехмерного вектора скорости молекулы, то есть а 2 = | ( х 2 ) = |У | , где, как и прежде, ( Е ) — средняя кинетическая энергия молекулы, а ( х 2 ) — средний квадрат ее скорости.
Вспомнив связь ( Е ) = (|-) = | кТ кинетического определения температуры как средней кинетической энергии молекул и абсолютной температуры Т , участвующей, например, в формуле Клапейрона уравнения состояния идеального газа (к = = 1, 38 • 10 -2| Дж/К — связывающая их постоянная Больцмана), можно всюду заменить та 2 на кТ и получить из (9), (10) классический вид формул соответствующих распределений:
/ ( х ) = 4^2 (-т- ) 2 е тт 2'хк!
и
Е е kT .
релятивистские или квантовые эффекты существенны, то классическое распределение Максвелла неприменимо. Например, оно перестает работать, когда температура Т газа 2 2 опускается до величин порядка так называемой температуры вырождения Т ^ ед = - 3 ^- , где п — число частиц, m — масса частицы, h — постоянная Планка, к — постоянная Больцмана.
Условие классичности (не квантовости) газа из п ^ 1 частиц и применимости к нему распределения Максвелла можно выразить также в виде соотношений пА 3 ^ 1, или ^ ^ 1, где А = ^ = ^ — длина волны де Бройля, соответствующая частице с импульсом р = mv, а V — приведенный объем, приходящийся на одну частицу ансамбля (газа). Иными словами, длина свободного пробега молекул должна быть велика по сравнению с величиной А.
3. Функции очень многих переменных
-
a) Проведенные в разделе 1 геометрические рассмотрения имеют некоторое общематематическое преимущество (ценность), поскольку могут служить базой для других полезных наблюдений, связанных с особенностями многомерных пространств и функций очень многих переменных. Такие функции имеют тенденцию быть почти постоянными с точки зрения наблюдателя (как, например, давление в термодинамике). Вообще, законы больших чисел имеют полезную геометрическую интерпретацию, которая заодно ведет к нелинейным обобщениям классических линейных законов. Особенность многомерного случая, связывающая геометрию с теорией вероятностей и ее законами больших чисел, состоит в том, что почти весь объем многомерного тела концентрируется в непосредственной близости границы тела (каждый может это понаблюдать на кубике или шаре большой размерности).
Или, например, почти вся площадь многомерной сферы сосредоточена в малой окрестности экватора, как и в окрестности любой иной поверхности, которая делит площадь сферы пополам. Уже отсюда вытекает, что любая регулярная (например, лип-шицева) функция на сфере почти постоянна с точки зрения наблюдателя, в том смысле, что если взять случайно и независимо пару точек сферы, то с почти единичной вероятностью эти значения будут почти совпадать. Можно даже дать соответствующие оценки, обобщающие на такие функции классический линейный закон больших чисел.
Отметим еще, что при рассмотрении многомерной сферы и выводе формулы (3), мы заодно получили и некоторую форму центральной предельной теоремы. В самом деле, ведь по существу доказано, что скалярное произведение < е, ж >= 2 - =1 е г Ж г любого фиксированного единичного вектора е G R - и случайного вектора ж G S п-1 (а 2 п) в пределе при п ^ то распределено нормально. В частности, если взять е = ^— (1,..., 1), а а 2 в (1) трактовать как дисперсию, то получим классический вид центральной предельной теоремы.
-
b) Для полноты сравнений рассмотрим еще дискретный случай, отвечающий квантовой постановке вопроса, и укажем соответствующее распределение.
Рассмотрим ансамбль из N одинаковых, но перенумерованных частиц или систем, каждая из которых может находиться в одном из перенумерованных состояний 1,2,..., Z,... Пусть 6 1 < 6 2 < ... < 6 } < ... — значения энергии индивидуальной системы в этих состояниях и а 1 ,а 2 ,... ,а } ,... — количество систем ансамбля, находящихся в состояниях 1,2,..., Z,... соответственно.
Такой набор а1, а2,..., ai,... может реализоваться многими способами. А точнее, число способов равно
Р =
N !
а 1 !а 2 ! .. .a i
Совокупность чисел а 1 ,а 2 ,... ,a i ,... должна удовлетворять условиям
У ci = N , У ^iai = Е , i i где теперь Е — полная совокупная энергия систем ансамбля.
Будем искать максимальное значение Р при указанных ограничениях, что даст нам наиболее вероятный набор а 1 ,а 2 ,... ,a i ,... чисел заполнения.
(Поясним, что в интересных для термодинамики случаях, когда число систем N и количество возможных уровней энергии е 1 очень велики, имеет место уже отмечавшееся выше явление концентрации. Можно показать, что общее число всех возможных при наших условиях состояний ансамбля почти совпадает с максимальным значением Р , которое мы намерены искать. Значит, мы действительно найдем и наиболее вероятный набор а 1 ,а 2 ,... ,a i ,... чисел заполнения.) Проведем эти несложные вычисления.
При больших значениях п по формуле Стирлинга n! ~ V 2ттп ( ^)” . Поэтому можно считать что log(n!) ~ n(log п — 1). (Здесь log = ln.)
Тогда, действуя методом Лагранжа отыскания условного экстремума, напишем, что
У log aidai + А У dai + ц У Eidai = 0 , i i i откуда следует, что при любом I выполняется равенство log ai + А + це1 = 0
a i = е
причем А и ц подчинены условиям
У S l e -x- ^ 5l =Е .
i
У е-"^1 = N ,
i
Обозначая через /N = U среднюю энергию, приходящуюся на одну систему ансамбля, можем записать полученный результат в следующем виде:
— = и= i £ie
N E е-^
8ц
log Уе ^ , i
е^№ ai = N—---- Ei е-^^
N 8 у — — log е ц 8e i
ЦЕ1
.
Дополнительные рассмотрения (в духе проведенных в разделе 2), выясняющие физический смысл величины ц в термодинамической ситуации, приводят к тому, что где к — постоянная Больцмана, а Т — абсолютная температура. Возникает важная величина, называемая статистической суммой:
Z = ^ е-& .
Теперь можно написать, как именно числа заполнения распределены по энергетическим уровням при данной абсолютной температуре:
a i = N
е кт
Z
Энтропия системы с точностью до аддитивной постоянной имеет вид
1 L £ i e кт
Т L е ^
U . , .
S = к log Z + — = к log 2 , е кт +
Остальные термодинамические функции (потенциалы) тоже допускают аналогичные выражения.
Полезно заметить, как ведет себя указанная энтропия при Т ^ 0. Пусть для общности нижнему уровню энергии отвечает п возможных состояний системы, то есть 6 1 = 6 2 = ... = 6 2 , и пусть следующие m уровней тоже одинаковы, то есть 6 n +1 = 6 п+2 . . . 6 п+т .
Тогда при Т ^ +0 мы имеем
S ~ к log I пе кт + те кт
+
£1 . Еп+1
1 пб 1 е кт + тб п +1 е кт
_ £1 _ £п+1 пе кт + те кт
откуда следует, что S ~ к log п при Т ^ +0. В частности, в физически значимом случае, когда п = 1, предел точно равен нулю. Но даже если п = 1 и п не грандиозно, величина к logn почти равна нулю, ввиду малости постоянной Больцмана (к ~ 1, 38 • 10 -23 Дж/К). Это отвечает постулату Нернста (третьему фундаментальному принципу или началу термодинамики), согласно которому при Т ^ +0 энтропия любой термодинамической системы стремится к общей постоянной, которую можно считать нулем.
Интересно связать этот дискретный случай с рассмотрениями, проведенными в разделах 2 и 3а. Какова тут геометрическая картина и какой предельный переход к случаю непрерывного распределения?
4. Термодинамический диапазон и рост фазового объема
Пусть ViW — объем шара радиуса г в R ” .
Тогда V n (r + А) — V n (г) = V 2 (г)А + (А) при А ^ 0 и, поскольку Vn(r) = с п гп, то К (г + А) — V ^ (г) = п/г^(г)А + (А).
В типичном для статистической физики (статистической термодинамики) случае величина г не постоянна, а меняется вместе с п (с числом частиц системы): г = г п х х п^э Это соответствует предположению, что энергия Е п системы (например порции идеального газа) пропорциональна количеству содержащихся в ней (системе) частиц. В фазовом пространстве R ” системы это и выражается соотношением г 2 = а 2 п = Е п .
В случае, когда г 2 = г 2 = ст2п, имеем
Vr n (r n + А) - К(г п ) = ст 2 г п Vr п (г n )А + (А)
или
V(г п ) = 2Рг п У п (г п ), где 2/3 = ст -2 .
Таким образом, в привычном для термодинамики диапазоне величин, когда п » 1, выполняется соотношение V ‘ (г) = 2[3гV (г), и потому V (г) = а ехр(/3г 2 ). Но мы знаем, что почти весь этот объем при п ^ 1 сосредоточен в непосредственной окрестности граничной сферы. Значит, с одной стороны, проекция такого шара на любое одномерное направление, как мы видели, при п ^ то распределяется по полученному выше закону (3). С другой стороны, глядя на формулу объема, появляется искушение сразу предположить, что самый естественный закон распределения плотности вероятностей в фазовом пространстве одной системы должен быть вида ехр( — 3г 2 ) = ехр( — ст -2 г 2 ) = ехр( — Е ).
Заметим, что теперь мы закон (3) могли бы рассмотреть чуть иначе (считая известным формулу объема п-мерного шара и асимптотическую формулу Стирлинга). Если на прямой, проходящей через центр шара, взять окрестность центра порядка 1 (точнее, составляющую 1/п 2 -е часть радиуса шара), то с ростом п, с точностью до экспоненциально убывающей относительной погрешности, почти весь объем шара будет проектироваться в эту окрестность. При ортогональном проектировании относительный (приведенный к единице) объем шара распределяется над этой окрестностью пропорционально (площади) объему сечений. Радиус сечения над точкой с ординатой ж вычисляется как г П — ж 2 . Но у нас ж ^ г п , значит г П — ж 2 ~ г п (1 — 2- 2 ). Отношение объемов (п — 1)-мерных шаров — рассматриваемого сечения над точкой ж и центрального сечения — равно (г п (1 — 2^ 2 )/г п ) п-1 . Учитывая, что г П = ст 2 п и то, что с ростом п размер рассматриваемой окрестности растет, в пределе при п > то получаем то же нормальное распределение (3) на всей прямой.
Конечно, можно было бы рассмотреть проекцию сферы на любой малый промежуток (ж, ж + dж) в пределах радиуса шара, а не только на окрестность нуля. Но при фиксированном значении ж и п ^ то это равносильно указанному рассмотрению малой окрестности начала координат.
Отметим, кстати, еще одну особенность шара, имеющего радиус порядка д/п в пространстве R 2 при п ^ 1. Объем такого шара как раз порядка единицы. Точнее, объем r^’J+Q единичного шара в R 2 при п ^ 1 асимптотически близок к ^= ( ^22^ • Поэтому шар объема 1 в пространстве R 2 при п ^ 1 имеет радиус асимптотически близкий к л /. 2 ^е
5. Заключительные замечания
Примем вслед за классиками (Gibbs) гипотезу, которая представляется вполне естественной, что в большой термодинамической системе, находящейся в термодинамическом равновесии, все малые подсистемы одинакового состава (например, молекулы) независимы (когда их взаимодействием можно пренебречь) и в вероятностном отношении распределены одинаково (по энергии или любому иному параметру, если он аддитивен). Тогда соответствующее распределение вероятностей должно быть именно гиббсовским каноническим.
Действительно, пусть /(Е) — искомая плотность распределения и пусть F — плот- ность распределения для систем, состоящих из пар таких исходных малых и независимых систем. Тогда F(Ei + Е2) = /(Ei)/(Е2). Допуская дифференцируемость функций, отсюда получаем F‘(Ei + Е2) = /‘(Ei)/(Е2) = /(Ei)/‘(Е2) и /‘(Ei)//(Ei) = = /‘(E2)//(E2). Значит, /(ж) = aexp(bx). Коэффициент b определяется из дополнительных соображений, связанных с природой конкретной задачи и рассматриваемых величин. Например, если ж — энергия Е, то b = — ^, где Т — абсолютная температура, а к — постоянная Больцмана. Коэффициент а нормирует распределение к единице.
Мы видим, что к гауссовскому нормальному закону распределения вероятностей и каноническому распределению Гиббса приводят совсем разные исходные данные, гипотезы и предположения. Одни, как принцип концентрации, имеют очень общую геометрическую интерпретацию, другие — более конкретны и относятся непосредственно к статистической механике и термодинамике. Например, одним из центральных объектов обсуждения книги [3] является получение распределения Гиббса, исходя из фундаментальных принципов гамильтоновой механики, пополняемых различными гипотезами о взаимодействии элементов системы.
Получение распределения Гиббса, исходя из термодинамического принципа максимальности энтропии равновесной термодинамической системы, в частности, обсуждается, например, в книге [1].
Физические посылки статистической термодинамики, в классическом и квантовом подходах, представлены, соответственно, например, в компактных книгах [4; 9]. Математическое оформление, обсуждение и развитие этих идей можно наблюдать, например, в работах [1; 6–8]. Принцип концентрации в его функционально-геометрических приложениях представлен в книге [11]. Элегантный курс лекций о геометрической сущности принципа концентрации меры представлен в [10].
Связь многомерной геометрии и статистической термодинамики отмечается также в развернутом обсуждении [5] взаимодействия математики и физики.
Связь классической термодинамики с контактной геометрией и статистической термодинамики с многомерной геометрией, а также роль последней, например, в вопросах передачи информации по каналу связи при наличии шума и теоремой Шеннона, затронуты в книге [2].
Материал настоящей заметки можно рассматривать как развитие моего доклада «Многомерная геометрия и функции очень многих переменных», сделанного на конференции «Геометрический анализ и его приложения», проведенной 26–30 мая 2014 г. в Волгограде.
ПРИМЕЧАНИЕ
-
1 Работа выполнена при поддержке Российского фонда фундаментальных исследований, грант № 13-01-12417-офи-м.
Список литературы Замечание о каноническом распределении
- Березин, Ф. А. Лекции по статистической физике/Ф. А. Березин. -М.; Ижевск: РХД, 2002. -192 c.
- Зорич, В. А. Математический анализ задач естествознания/В. А. Зорич. -М.: МЦНМО, 2008. -135 c.
- Козлов, В. В. Тепловое равновесие по Гиббсу и Пуанкаре/В. В. Козлов. -М.; Ижевск: РХД, 2002. -319 c.
- Лоренц, Г. А. Статистические теории в термодинамике/Г. А. Лоренц. -М.; Ижевск: РХД, 2001. -192 c.
- Манин, Ю. И. Математика как метафора/Ю. И. Манин. -М.: МЦНМО, 2008. -411 c.
- Минлос, Р. А. Введение в математическую статистическую физику/Р. А. Минлос. -М.: МЦНМО, 2002. -111 c.
- Опойцев, В. И. Нелинейный закон больших чисел/В. И. Опойцев//Автоматика и телемеханика. -1994. -№ 4. -C. 65-75.
- Хинчин, А. Я. Симметрические функции на многомерных поверхностях/А. Я. Хинчин//Сборник памяти Александра Александровича Андронова. -М.: Изд-во АН СССР, 1955. -C. 541-576.
- Шредингер, Э. Лекции по физике/Э. Шредингер. -М.; Ижевск: РХД, 2001. -160 c.
- Ball, K. An Elementary Introduction to Modern Convex Geometry/K. Ball//MSRI Publications, Flavors of Geometry. -1997. -Vol. 31. -P. 1-58.
- Milman, V. Asymptotic Theory of Finite Dimensional Normed Spaces/V. Milman, G. Schechtman//Springer Lecture Notes in Mathematics. -1986. -Vol. 1200. -P. 160.