Замечание о каноническом распределении
Автор: Зорич Владимир Антонович
Журнал: Математическая физика и компьютерное моделирование @mpcm-jvolsu
Рубрика: Математика
Статья в выпуске: 3 (22), 2014 года.
Бесплатный доступ
Каноническое распределение Гиббса широко используется в статистической термодинамике. Его формальному обоснованию (исходя из некоторых фундаментальных или представляющихся более простыми принципов и положений) посвящено много серьезных работ. Мы здесь остановимся на одной геометрической модели, которая в привычных для термодинамики предположениях тоже ведет к распределению Гиббса.
Короткий адрес: https://sciup.org/14968749
IDR: 14968749
Текст научной статьи Замечание о каноническом распределении
1. Газ, многомерная сфера и малая часть большой системы
Рассмотрим однородный газ в какой-то покоящейся емкости. Пусть v 1 , ...,v n — трехмерные векторы скорости молекул. В стандартных условиях естественно считать, что совокупная кинетическая энергия Е п = S ” =1| mv 2 молекул пропорциональна их количеству п, то есть Е п = Еп и ©' 1 v 2 = 2^ п. Последнее соотношение определяет сферу радиуса 2^ п в пространстве R 3 ” . Пусть это будет пояснением к физической интерпретации следующих геометрических рассмотрений.
В п-мерном евклидовом пространстве R ” рассмотрим сферу S ” 1 (г) радиуса г = = а^/п с центром в начале координат, заданную уравнением
2 , , 2 2
ж 1 + ... + ж га = а п.
Эту сферу S ” -1© ) спроектируем ортогонально на прямую, проходящую через ее центр, например, на какую-то (пусть первую) координатную ось. Получится отрезок [ - г,г]. Фиксируем отрезок [а,Ь] С [ - г,г]. Пусть S[а,Ь] — площадь той части S ”— (г) сферы S ” -1 (г), которая проектируется в отрезок [а, Ь]. Подсчитав отношение J—^] , то есть вероятность Рг „ [а,Ь] того, что случайно выбранная точка сферы окажется в слое S^ (г) над отрезком [а, Ь] (полагая, что точки распределены по сфере равномерно), найдем, что
Pr n [a, 6] =
J C (1 - ( x/r ) 2 ) 2 dec J!T (1 - (x/r) 2 ) " - 3 dx
Вспоминая, что в интересной для термодинамики ситуации r = стл/п, а п ^ 1, переходя к пределу при п ^ то , приходим к классическому нормальному закону распределения вероятностей
Pr n [a < x < b] ^
1 \ 2 xct
/ е " 2 dx.
J Ct
Мы получили ра с пределение вероятностей значений одной координаты случайной точки сферы Sn-1(a^n) C R ” при п » 1.
При термодинамической интерпретации мы в (3) фактически имеем (с точностью до естественных переобозначений и преобразований) закон распределения координат скорости (а тем самым и энергии) одной частицы в огромной системе, энергию которой можно считать бесконечно большой.
Каноническое распределение Гиббса, вообще говоря, относится к любой малой части очень большой системы, находящейся в термодинамическом равновесии. Именно в этом его универсальность.
Если бы мы следили не за одной частицей, а за порцией из любого конечного числа частиц, то, спроектировав сферу на координатное подпространство, отвечающее этим частицам, мы, конечно, получили бы снова нормальное распределение, но в пространстве соответствующей размерности. Впрочем, это следует уже из полученного результата с учетом предполагаемой независимости частиц.
вероятности величины х =
Пусть Р — плотность распределения вероятностей случайного вектора x = (х 1 ,...,х п ) в пространстве R n . Считая, что координаты вектора распределены соответственно с плотностями p i и независимы, имеем
Р(хъ ...,хп) = pi(^i) •... • Pn(хn), а если, к тому же, в пространстве нет привилегированных направлений, то Р зависит только от модуля х = |x| вектора или, например, от его скалярного квадрата х2 = x2, a p1 = ... = pn = p. Позволив себе небольшую вольность, сохраним то же обозначение Р для функции Р(х2) от х2, заменив ею Р(х1, ...,хп).
Дифференцируя равенство
1одР (х 2 ) = log p(х 1 ) + ... + log p(х п )
по каждой из переменных х 1 ,...,х п последовательно (после очевидных арифметических преобразований), получаем
2 Р ' (х 2 ) = p' (х 1 ) = = p' (х п )
Р (х 2 ) X 1 P(X 1 ) ... X п P(X п )
где а — постоянная (ввиду равенства функций от разных независимых переменных).
Решая уравнения ^^ = ах » , находим, что p(х i ) = Ле 5 .
Из равенства J +” p(х i )dх i = 1, нормирующего полную вероятность, вычислив ин- ^^2
теграл J+” Ле-dх = Ла /^д/^ = 1, получаем связь Л = ^|^, то есть p(хi) = ш2
—е 2^ е
.
Задание, например, второго момента
Z +”
х^p(х i )dх i = ст2,
а
∞ после вычисления интеграла
+”
J”Чт/ 2 5 = Vs(-2) 55 L е 2 *
полностью определит (уже знакомую нам из формулы (3)) функцию
p(хi) = (У2^ст) 1е 2^2,(5)
и искомую общую функцию
П 11+... + 1^
Р (х 1 ,..., х п ) = (2лст 2 ) 2 е 252 = (2лст 2 ) 2 е 252 .
Напомним, что если случайные величины х, х функционально связаны, то их плотности распределения /, / связаны соотношением /(х)5х = / (х)5х, которое, зная зависимости х = х(х),х = х(х), позволяет находить одну из функций /, / по другой.
Имея функцию (6) плотности распределения вероятностей случайного вектора (х1,...,хп) в пространстве Rn, можно указать функцию /(х) распределения модуля х = ^х1 + ... + х^ этого вектора. Достаточно рассмотреть в пространстве R” сферические координаты и проинтегрировать функцию (6) по сфере соответствующего радиуса х:
х 2
/ (х) = шп_1 х"-1 • (2жг2)-2 е-.2.(7)
Здесь ш п - 1 — площадь, то есть (п — 1)-мера, единичной сферы в пространстве R ” .
Из упомянутого выше общего соотношения /(х) = /(х) h теперь можно получить и функцию F распределения величины х = х 2 — квадрата модуля вектора (х 1 , ...,х „ ) :
П- 1 п х 1
F(х) = шп-1х 2 • (2^а2) 2е • (-х 2).(8)
х " + х " + х " трехмерного вектора скорости молекул
В частности, для модуля х = газа из (7) при п = 3 получаем
3 V 2
/ (х) = 4^х 2 • (2^а 2 ) 2 е 2 ^ 2 .
Переходя к кинетической энергии Е = | тх 2 отсюда (или из (8) при п = 3 и Е = = | тх), получаем плотность распределения вероятностей значений энергии случайной молекулы газа
2Е _ 3 _ 2Е 1 / 2 [
F < Е ) =- • ■) _ 2е ^ • 2 V тЕ = 2у
Е
Е
---------- е тХ 2 .
^(та 2 )
Для того чтобы последние формулы приобрели достаточно законченный с точки зрения физики вид, необходимо раскрыть физический смысл параметра а или произведения та 2 .
Применительно к рассматриваемой ситуации идеального газа формула (5), определяющая а 2 , показывает, что а 2 в нашем случае есть среднее значение (математическое ожидание) квадрата компоненты (координаты) трехмерного вектора скорости молекулы, то есть а 2 = | ( х 2 ) = |У | , где, как и прежде, ( Е ) — средняя кинетическая энергия молекулы, а ( х 2 ) — средний квадрат ее скорости.
Вспомнив связь ( Е ) = (|-) = | кТ кинетического определения температуры как средней кинетической энергии молекул и абсолютной температуры Т , участвующей, например, в формуле Клапейрона уравнения состояния идеального газа (к = = 1, 38 • 10 -2| Дж/К — связывающая их постоянная Больцмана), можно всюду заменить та 2 на кТ и получить из (9), (10) классический вид формул соответствующих распределений:
/ ( х ) = 4^2 (-т- ) 2 е тт 2'хк!
и
Е е kT .
релятивистские или квантовые эффекты существенны, то классическое распределение Максвелла неприменимо. Например, оно перестает работать, когда температура Т газа 2 2 опускается до величин порядка так называемой температуры вырождения Т ^ ед = - 3 ^- , где п — число частиц, m — масса частицы, h — постоянная Планка, к — постоянная Больцмана.
Условие классичности (не квантовости) газа из п ^ 1 частиц и применимости к нему распределения Максвелла можно выразить также в виде соотношений пА 3 ^ 1, или ^ ^ 1, где А = ^ = ^ — длина волны де Бройля, соответствующая частице с импульсом р = mv, а V — приведенный объем, приходящийся на одну частицу ансамбля (газа). Иными словами, длина свободного пробега молекул должна быть велика по сравнению с величиной А.
3. Функции очень многих переменных
-
a) Проведенные в разделе 1 геометрические рассмотрения имеют некоторое общематематическое преимущество (ценность), поскольку могут служить базой для других полезных наблюдений, связанных с особенностями многомерных пространств и функций очень многих переменных. Такие функции имеют тенденцию быть почти постоянными с точки зрения наблюдателя (как, например, давление в термодинамике). Вообще, законы больших чисел имеют полезную геометрическую интерпретацию, которая заодно ведет к нелинейным обобщениям классических линейных законов. Особенность многомерного случая, связывающая геометрию с теорией вероятностей и ее законами больших чисел, состоит в том, что почти весь объем многомерного тела концентрируется в непосредственной близости границы тела (каждый может это понаблюдать на кубике или шаре большой размерности).
Или, например, почти вся площадь многомерной сферы сосредоточена в малой окрестности экватора, как и в окрестности любой иной поверхности, которая делит площадь сферы пополам. Уже отсюда вытекает, что любая регулярная (например, лип-шицева) функция на сфере почти постоянна с точки зрения наблюдателя, в том смысле, что если взять случайно и независимо пару точек сферы, то с почти единичной вероятностью эти значения будут почти совпадать. Можно даже дать соответствующие оценки, обобщающие на такие функции классический линейный закон больших чисел.
Отметим еще, что при рассмотрении многомерной сферы и выводе формулы (3), мы заодно получили и некоторую форму центральной предельной теоремы. В самом деле, ведь по существу доказано, что скалярное произведение < е, ж >= 2 - =1 е г Ж г любого фиксированного единичного вектора е G R - и случайного вектора ж G S п-1 (а 2 п) в пределе при п ^ то распределено нормально. В частности, если взять е = ^— (1,..., 1), а а 2 в (1) трактовать как дисперсию, то получим классический вид центральной предельной теоремы.
-
b) Для полноты сравнений рассмотрим еще дискретный случай, отвечающий квантовой постановке вопроса, и укажем соответствующее распределение.
Рассмотрим ансамбль из N одинаковых, но перенумерованных частиц или систем, каждая из которых может находиться в одном из перенумерованных состояний 1,2,..., Z,... Пусть 6 1 < 6 2 < ... < 6 } < ... — значения энергии индивидуальной системы в этих состояниях и а 1 ,а 2 ,... ,а } ,... — количество систем ансамбля, находящихся в состояниях 1,2,..., Z,... соответственно.
Такой набор а1, а2,..., ai,... может реализоваться многими способами. А точнее, число способов равно
Р =
N !
а 1 !а 2 ! .. .a i
Совокупность чисел а 1 ,а 2 ,... ,a i ,... должна удовлетворять условиям
У ci = N , У ^iai = Е , i i где теперь Е — полная совокупная энергия систем ансамбля.
Будем искать максимальное значение Р при указанных ограничениях, что даст нам наиболее вероятный набор а 1 ,а 2 ,... ,a i ,... чисел заполнения.
(Поясним, что в интересных для термодинамики случаях, когда число систем N и количество возможных уровней энергии е 1 очень велики, имеет место уже отмечавшееся выше явление концентрации. Можно показать, что общее число всех возможных при наших условиях состояний ансамбля почти совпадает с максимальным значением Р , которое мы намерены искать. Значит, мы действительно найдем и наиболее вероятный набор а 1 ,а 2 ,... ,a i ,... чисел заполнения.) Проведем эти несложные вычисления.
При больших значениях п по формуле Стирлинга n! ~ V 2ттп ( ^)” . Поэтому можно считать что log(n!) ~ n(log п — 1). (Здесь log = ln.)
Тогда, действуя методом Лагранжа отыскания условного экстремума, напишем, что
У log aidai + А У dai + ц У Eidai = 0 , i i i откуда следует, что при любом I выполняется равенство log ai + А + це1 = 0
a i = е
причем А и ц подчинены условиям
У S l e -x- ^ 5l =Е .
i
У е-"^1 = N ,
i
Обозначая через /N = U среднюю энергию, приходящуюся на одну систему ансамбля, можем записать полученный результат в следующем виде:
— = и= i £ie
N E е-^
8ц
log Уе ^ , i
е^№ ai = N—---- Ei е-^^
N 8 у — — log е ц 8e i
ЦЕ1
.
Дополнительные рассмотрения (в духе проведенных в разделе 2), выясняющие физический смысл величины ц в термодинамической ситуации, приводят к тому, что где к — постоянная Больцмана, а Т — абсолютная температура. Возникает важная величина, называемая статистической суммой:
Z = ^ е-& .
Теперь можно написать, как именно числа заполнения распределены по энергетическим уровням при данной абсолютной температуре:
a i = N
е кт
Z
Энтропия системы с точностью до аддитивной постоянной имеет вид
1 L £ i e кт
Т L е ^
U . , .
S = к log Z + — = к log 2 , е кт +
Остальные термодинамические функции (потенциалы) тоже допускают аналогичные выражения.
Полезно заметить, как ведет себя указанная энтропия при Т ^ 0. Пусть для общности нижнему уровню энергии отвечает п возможных состояний системы, то есть 6 1 = 6 2 = ... = 6 2 , и пусть следующие m уровней тоже одинаковы, то есть 6 n +1 = 6 п+2 . . . 6 п+т .
Тогда при Т ^ +0 мы имеем
S ~ к log I пе кт + те кт
+
£1 . Еп+1
1 пб 1 е кт + тб п +1 е кт
_ £1 _ £п+1 пе кт + те кт
откуда следует, что S ~ к log п при Т ^ +0. В частности, в физически значимом случае, когда п = 1, предел точно равен нулю. Но даже если п = 1 и п не грандиозно, величина к logn почти равна нулю, ввиду малости постоянной Больцмана (к ~ 1, 38 • 10 -23 Дж/К). Это отвечает постулату Нернста (третьему фундаментальному принципу или началу термодинамики), согласно которому при Т ^ +0 энтропия любой термодинамической системы стремится к общей постоянной, которую можно считать нулем.
Интересно связать этот дискретный случай с рассмотрениями, проведенными в разделах 2 и 3а. Какова тут геометрическая картина и какой предельный переход к случаю непрерывного распределения?
4. Термодинамический диапазон и рост фазового объема
Пусть ViW — объем шара радиуса г в R ” .
Тогда V n (r + А) — V n (г) = V 2 (г)А + (А) при А ^ 0 и, поскольку Vn(r) = с п гп, то К (г + А) — V ^ (г) = п/г^(г)А + (А).
В типичном для статистической физики (статистической термодинамики) случае величина г не постоянна, а меняется вместе с п (с числом частиц системы): г = г п х х п^э Это соответствует предположению, что энергия Е п системы (например порции идеального газа) пропорциональна количеству содержащихся в ней (системе) частиц. В фазовом пространстве R ” системы это и выражается соотношением г 2 = а 2 п = Е п .
В случае, когда г 2 = г 2 = ст2п, имеем
Vr n (r n + А) - К(г п ) = ст 2 г п Vr п (г n )А + (А)
или
V(г п ) = 2Рг п У п (г п ), где 2/3 = ст -2 .
Таким образом, в привычном для термодинамики диапазоне величин, когда п » 1, выполняется соотношение V ‘ (г) = 2[3гV (г), и потому V (г) = а ехр(/3г 2 ). Но мы знаем, что почти весь этот объем при п ^ 1 сосредоточен в непосредственной окрестности граничной сферы. Значит, с одной стороны, проекция такого шара на любое одномерное направление, как мы видели, при п ^ то распределяется по полученному выше закону (3). С другой стороны, глядя на формулу объема, появляется искушение сразу предположить, что самый естественный закон распределения плотности вероятностей в фазовом пространстве одной системы должен быть вида ехр( — 3г 2 ) = ехр( — ст -2 г 2 ) = ехр( — Е ).
Заметим, что теперь мы закон (3) могли бы рассмотреть чуть иначе (считая известным формулу объема п-мерного шара и асимптотическую формулу Стирлинга). Если на прямой, проходящей через центр шара, взять окрестность центра порядка 1 (точнее, составляющую 1/п 2 -е часть радиуса шара), то с ростом п, с точностью до экспоненциально убывающей относительной погрешности, почти весь объем шара будет проектироваться в эту окрестность. При ортогональном проектировании относительный (приведенный к единице) объем шара распределяется над этой окрестностью пропорционально (площади) объему сечений. Радиус сечения над точкой с ординатой ж вычисляется как г П — ж 2 . Но у нас ж ^ г п , значит г П — ж 2 ~ г п (1 — 2- 2 ). Отношение объемов (п — 1)-мерных шаров — рассматриваемого сечения над точкой ж и центрального сечения — равно (г п (1 — 2^ 2 )/г п ) п-1 . Учитывая, что г П = ст 2 п и то, что с ростом п размер рассматриваемой окрестности растет, в пределе при п > то получаем то же нормальное распределение (3) на всей прямой.
Конечно, можно было бы рассмотреть проекцию сферы на любой малый промежуток (ж, ж + dж) в пределах радиуса шара, а не только на окрестность нуля. Но при фиксированном значении ж и п ^ то это равносильно указанному рассмотрению малой окрестности начала координат.
Отметим, кстати, еще одну особенность шара, имеющего радиус порядка д/п в пространстве R 2 при п ^ 1. Объем такого шара как раз порядка единицы. Точнее, объем r^’J+Q единичного шара в R 2 при п ^ 1 асимптотически близок к ^= ( ^22^ • Поэтому шар объема 1 в пространстве R 2 при п ^ 1 имеет радиус асимптотически близкий к л /. 2 ^е
5. Заключительные замечания
Примем вслед за классиками (Gibbs) гипотезу, которая представляется вполне естественной, что в большой термодинамической системе, находящейся в термодинамическом равновесии, все малые подсистемы одинакового состава (например, молекулы) независимы (когда их взаимодействием можно пренебречь) и в вероятностном отношении распределены одинаково (по энергии или любому иному параметру, если он аддитивен). Тогда соответствующее распределение вероятностей должно быть именно гиббсовским каноническим.
Действительно, пусть /(Е) — искомая плотность распределения и пусть F — плот- ность распределения для систем, состоящих из пар таких исходных малых и независимых систем. Тогда F(Ei + Е2) = /(Ei)/(Е2). Допуская дифференцируемость функций, отсюда получаем F‘(Ei + Е2) = /‘(Ei)/(Е2) = /(Ei)/‘(Е2) и /‘(Ei)//(Ei) = = /‘(E2)//(E2). Значит, /(ж) = aexp(bx). Коэффициент b определяется из дополнительных соображений, связанных с природой конкретной задачи и рассматриваемых величин. Например, если ж — энергия Е, то b = — ^, где Т — абсолютная температура, а к — постоянная Больцмана. Коэффициент а нормирует распределение к единице.
Мы видим, что к гауссовскому нормальному закону распределения вероятностей и каноническому распределению Гиббса приводят совсем разные исходные данные, гипотезы и предположения. Одни, как принцип концентрации, имеют очень общую геометрическую интерпретацию, другие — более конкретны и относятся непосредственно к статистической механике и термодинамике. Например, одним из центральных объектов обсуждения книги [3] является получение распределения Гиббса, исходя из фундаментальных принципов гамильтоновой механики, пополняемых различными гипотезами о взаимодействии элементов системы.
Получение распределения Гиббса, исходя из термодинамического принципа максимальности энтропии равновесной термодинамической системы, в частности, обсуждается, например, в книге [1].
Физические посылки статистической термодинамики, в классическом и квантовом подходах, представлены, соответственно, например, в компактных книгах [4; 9]. Математическое оформление, обсуждение и развитие этих идей можно наблюдать, например, в работах [1; 6–8]. Принцип концентрации в его функционально-геометрических приложениях представлен в книге [11]. Элегантный курс лекций о геометрической сущности принципа концентрации меры представлен в [10].
Связь многомерной геометрии и статистической термодинамики отмечается также в развернутом обсуждении [5] взаимодействия математики и физики.
Связь классической термодинамики с контактной геометрией и статистической термодинамики с многомерной геометрией, а также роль последней, например, в вопросах передачи информации по каналу связи при наличии шума и теоремой Шеннона, затронуты в книге [2].
Материал настоящей заметки можно рассматривать как развитие моего доклада «Многомерная геометрия и функции очень многих переменных», сделанного на конференции «Геометрический анализ и его приложения», проведенной 26–30 мая 2014 г. в Волгограде.
ПРИМЕЧАНИЕ
-
1 Работа выполнена при поддержке Российского фонда фундаментальных исследований, грант № 13-01-12417-офи-м.
Список литературы Замечание о каноническом распределении
- Березин, Ф. А. Лекции по статистической физике/Ф. А. Березин. -М.; Ижевск: РХД, 2002. -192 c.
- Зорич, В. А. Математический анализ задач естествознания/В. А. Зорич. -М.: МЦНМО, 2008. -135 c.
- Козлов, В. В. Тепловое равновесие по Гиббсу и Пуанкаре/В. В. Козлов. -М.; Ижевск: РХД, 2002. -319 c.
- Лоренц, Г. А. Статистические теории в термодинамике/Г. А. Лоренц. -М.; Ижевск: РХД, 2001. -192 c.
- Манин, Ю. И. Математика как метафора/Ю. И. Манин. -М.: МЦНМО, 2008. -411 c.
- Минлос, Р. А. Введение в математическую статистическую физику/Р. А. Минлос. -М.: МЦНМО, 2002. -111 c.
- Опойцев, В. И. Нелинейный закон больших чисел/В. И. Опойцев//Автоматика и телемеханика. -1994. -№ 4. -C. 65-75.
- Хинчин, А. Я. Симметрические функции на многомерных поверхностях/А. Я. Хинчин//Сборник памяти Александра Александровича Андронова. -М.: Изд-во АН СССР, 1955. -C. 541-576.
- Шредингер, Э. Лекции по физике/Э. Шредингер. -М.; Ижевск: РХД, 2001. -160 c.
- Ball, K. An Elementary Introduction to Modern Convex Geometry/K. Ball//MSRI Publications, Flavors of Geometry. -1997. -Vol. 31. -P. 1-58.
- Milman, V. Asymptotic Theory of Finite Dimensional Normed Spaces/V. Milman, G. Schechtman//Springer Lecture Notes in Mathematics. -1986. -Vol. 1200. -P. 160.