Acessibilidade / Reportar erro

Sobre a Dedução do Axioma de Carathéodory da Segunda Lei da Termodinâmica dos Princípios de Clausius e Kelvin

On the Deduction of the Carathéodory’s Axiom of the Second Law of Thermodynamics from the Clausius and Kelvin Principles

Resumos

O formalismo de Carathéodory para a termodinâmica clássica é uma rica abordagem alternativa para essa teoria, apesar de impopular entre estudantes e professores de física. Essa abordagem dispensa o conteúdo das máquinas térmicas para a apresentação da segunda lei da termodinâmica. Neste artigo, discutimos o formalismo de Carathéodory historicamente, e mostramos como o axioma de Carathéodory da segunda lei da termodinâmica se deduz, didaticamente, do princípio de Clausius e do princípio de Kelvin. Além disso, fornecendo também um caráter objetivo para este artigo, no sentido de buscar popularizar o ensino do formalismo de Carathéodory em disciplinas de termodinâmica clássica em nível de graduação, guiamos o leitor até a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica através desse formalismo. Por último, considerando a ampla literatura revisada, a prova que demos para a dedução do axioma de Carathéodory da segunda lei da termodinâmica a partir do princípio de Clausius é nova.

Palavras-chave
formalismo de Carathéodory; axioma de Carathéodory; segunda lei da termodinâmica; princípio de Clausius; princípio de Kelvin


Carathéodory’s formalism for classical thermodynamics is a rich alternative approach to this theory, although unpopular with students and physics professors. This approach dispenses with the content of thermal machines for the presentation of the second law of thermodynamics. In this paper, we discuss Carathéodory’s formalism historically, and show how Carathéodory’s axiom of the second law of thermodynamics is derived, didactically, from the Clausius principle and the Kelvin principle. In addition, also providing an objective character for this paper, in the sense of seeking to popularize the teaching of Carathéodory’s formalism in disciplines of classical thermodynamics at undergraduate level, we guide the reader to obtain the entropy and mathematical content of the second law of thermodynamics through this formalism. Finally, considering the wide reviewed literature, the proof we gave for deducing the Carathéodory’s axiom of the second law of thermodynamics from the Clausius principle is new.

Keywords
Carathéodory’s formalism; Carathéodory’s axiom; second law of thermodynamics; Clausius principle; Kelvin principle


1. Introdução

Na física, costumeiramente somos apresentados a abordagens conceituais e matemáticas distintas, porém equivalentes, para uma mesma teoria. Por equivalentes entende-se dizer que essas descrições distintas para uma mesma teoria obtêm, sem nenhuma perda de conteúdo físico, os mesmos resultados finais. Além disso, geralmente, os caminhos e métodos utilizados por cada descrição diferem enormemente entre si. A essas descrições distintas para uma mesma teoria damos o nome de formalismos. Um caso famoso de formalismos na física ocorre na mecânica clássica, onde temos os formalismos devidos a Newton, Lagrange, e Hamilton.

Outra disciplina da física que permite o uso de formalismos é a termodinâmica clássica. A termodinâmica clássica é a perspectiva da termodinâmica que estuda os sistemas físicos a partir das leis que generalizam as observações feitas sobre o comportamento macroscópico desses sistemas. Para isso, a termodinâmica clássica desconsidera a natureza microscópica da matéria. Isso difere de outra perspectiva famosa da termodinâmica que considera para a sua descrição a natureza microscópica da matéria e os avanços da mecânica estatística. Essa outra perspectiva da termodinâmica é a termodinâmica estatística. Não será sobre a termodinâmica estatística que estaremos lidando aqui.

A termodinâmica clássica é uma área da física altamente solidificada e bem estabelecida em todo o meio científico. Outrossim, trata-se de uma teoria cujo conteúdo é consideravelmente popular, desde os níveis mais básicos de educação em ciências, até em cursos de nível superior em física e áreas afins, como química, engenharias, etc. Assim, o material teórico fundamental da termodinâmica clássica deve causar pouca estranheza ao leitor. Especificamente sobre os formalismos existentes para a termodinâmica clássica, e também sobre o seu próprio ensino em nível de graduação, é notável a tradicional apresentação dessa disciplina segundo a perspectiva da eficiência dos motores térmicos – ou máquinas térmicas.

Majoritário nos livros didáticos atuais, esse formalismo tradicional faz uso dos dois princípios experimentais equivalentes da segunda lei da termodinâmica – os princípios de Clausius e Kelvin – em conjunto com o teorema de Carnot das máquinas térmicas, para a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica – o princípio do aumento da entropia. Esse formalismo tradicional foi construído por Clausius com base em desenvolvimentos históricos e técnicos de nomes como Carnot, Clapeyron, e Kelvin [11. I. Müller, A History of Thermodynamics: The Doctrine of Energy and Entropy (Springer, Berlin, 2007).]. Assim, nomeamos aqui esse formalismo tradicional de formalismo de Clausius, inspirados também pela literatura didática da termodinâmica clássica [22. M.J. Oliveira, Equilibrium Thermodynamics (Springer, Berlin, 2017), 2ª ed.].

Todavia, como já anunciamos previamente, o formalismo de Clausius não é o único possível para descrever a termodinâmica clássica. Outro formalismo famoso se originou do trabalho de Gibbs [33. J.W. Gibbs, The Collected Works of J. Willard Gibbs. Volume I: Thermodynamics (Longmans, London, 1928).] que, em uma série de artigos entre 1873 e 1878, advogou por métodos analíticos para a descrição da termodinâmica clássica. Com isso, Gibbs influenciou várias obras populares de termodinâmica clássica que surgiram posteriormente [44. H. Callen, Thermodynamics and an Introduction to Thermostatistics (Wiley, New York, 1985), 2ª ed., 55. E.A. Guggenheim, Thermodynamics: An Advanced Treatment for Chemists and Physicists (North-holland, Amsterdam, 1986), 8ª ed.]. Essas obras construíram uma termodinâmica clássica de postulados, introduzindo noções termodinâmicas fundamentais como a entropia na forma de conceitos elementares dos quais os outros conceitos da teoria se derivam [66. M.J. Oliveira, Rev. Bras. Ens. Fís. 41, e20180174 (2019).]. De forma geral, chamamos aqui de formalismo de Gibbs os formalismos devidos ao pioneiro trabalho de Gibbs.

Além desses, há ainda o formalismo de Carathéodory para a termodinâmica clássica, sendo esse o formalismo que mais nos interessa neste artigo. O formalismo de Carathéodory difere dos outros dois formalismos citados anteriormente uma vez que dispensa as máquinas térmicas utilizadas no formalismo de Clausius, bem como, apesar de também se valer de postulados, ou axiomas, não o faz usando a mesma metodologia envolvida no formalismo de Gibbs. O formalismo de Carathéodory tem um importante papel na construção da própria teoria da termodinâmica clássica, conforme relata a seguinte citação:

Entropy was discovered by a somewhat circuitous path through the efficiency of heat engines, a finding that in hindsight could appear serendipitous. Were we just lucky to have discovered something so fundamental in this way? Can it be seen directly that entropy as a state variable is contained in the structure of thermodynamics, without the baggage of heat engines? It can, as shown by Constantin Carathéodory in 1909.

(A entropia foi descoberta por um caminho um tanto tortuoso através da eficiência dos motores térmicos. Uma descoberta que, em retrospectiva, poderia parecer acidental. Tivemos a sorte de ter descoberto algo tão fundamental dessa maneira? Pode ser visto diretamente que a entropia como uma variável de estado está contida na estrutura da termodinâmica, sem a bagagem dos motores térmicos? Pode, como mostrado por Constantin Carathéodory em 1909.)

[p. 149, ênfase do autor][77. J.H. Luscombe, Thermodynamics (CRC Press, Boca Raton, 2018).]

Essas são as primeiras palavras de James H. Luscombe na introdução do décimo capítulo do seu recente1 1 Luscombe apresenta em seu livro uma abordagem moderna do formalismo de Carathéodory, trabalhando-o com o conceito de campos vetoriais. Thermodynamics [77. J.H. Luscombe, Thermodynamics (CRC Press, Boca Raton, 2018).]. Apesar da sua reconhecida importância2 2 O trabalho de Carathéodory é um marco histórico no que se refere à s bases descritivas de uma termodinâmica clássica analítica [8, 9]. , o formalismo de Carathéodory é quase totalmente desconhecido atualmente pela maioria dos professores e estudantes de física. Atualmente também são escassos os exemplos de produções didáticas que ensinam o formalismo de Carathéodory. Dito isso, apresentamos na seção 2 2. Formalismo de Carathéodory Em um artigo de 1909 publicado no Mathematische Annalen, o matemático Constantin Carathéodory [10], propôs um formalismo para a termodinâmica clássica que obtinha os resultados da teoria3 a partir de dois axiomas, um para a primeira lei, e outro para a segunda lei da termodinâmica, de forma que o desenvolvimento dos conceitos termodinâmicos se dava em termos de considerações oriundas de conceitos mecânicos. O axioma usado por Carathéodory para a segunda lei da termodinâmica foi a maior novidade do seu trabalho. Esse axioma não era baseado em experimentos, não obstante, dele emergiam a entropia e o seu conteúdo matemático clássico. Apesar desse axioma ser eventualmente conhecido como o segundo axioma de Carathéodory [12], dada a existência de um axioma de Carathéodory também para a primeira lei da termodinâmica, nosso maior foco aqui é o estudo em particular da segunda lei da termodinâmica. Por esse motivo, doravante iremos nos referir ao axioma de Carathéodory para a segunda lei da termodinâmica apenas como axioma de Carathéodory. Vários autores se dedicaram à missão de disseminar as ideias de Carathéodory ao longo dos anos, a saber: Sears [12], Chandrasekhar [13], Buchdahl [14], Landsberg [15], Dunning-Davies [16], entre outros. Em especial, Max Born, um dos físicos precursores da mecânica quântica, defendeu a visão de Carathéodory durante uma grande parte da sua vida. Com publicações [17, 18] e também com duras críticas ao formalismo de Clausius, Born buscou popularizar o formalismo de Carathéodory ao dizer, por exemplo, em um artigo de 1921: a) Não existe nenhuma outra área da física onde são aplicadas considerações que tenham qualquer semelhança com o ciclo de Carnot e correlatos. b) Tem-se que admitir que a termodinâmica, no seu modelo tradicional, ainda não realizou o ideal lógico da separação entre o conteúdo físico e a descrição matemática. c) É preciso fazer uma remoção de entulhos, que uma tradição cheia de piedade demais até aqui, não ousou remover. [ênfase do autor][17] Em correspondência a Einstein [19], exatamente sobre essa publicação [17] que submetia ao atual Physikalische Zeitschrift, Born escreveu: Frankfurt a.M. 12 February, 1921 Dear Einstein …I have done little theoretical work. I have recently written an account of Carathéodory’s thermodynamics, which will appear shortly in the Physikalische Zeitung. I am very curious to know what you will say about it. Frankfurt a.M. 12 Fevereiro, 1921 (Prezado Einstein …Tenho feito pouco trabalho teórico. Recentemente escrevi uma exposição da termodinâmica de Carathéodory, a qual irá aparecer em breve no Physikalische Zeitung. Estou muito curioso para saber o que você dirá a respeito.) (19 – p. 53) Já havendo publicado os trabalhos que elevariam seu nome ao patamar de um dos maiores da história da ciência – sobre a relatividade e o efeito fotoelétrico –, um retorno positivo de Einstein a respeito do formalismo de Carathéodory com certeza poderia ter proporcionado a esse assunto uma recepção diferente da comunidade da física. Mas, apesar da solicitação de Born, não constam nas posteriores correspondências entre Born e Einstein [19] qualquer menção desse último a questão do trabalho de Carathéodory. Posteriormente, e ainda sobre a sua tentativa de popularizar o trabalho de Carathéodory, a frustração de Born se confirma quando ele afirma, se referindo por método clássico ao que chamamos aqui de formalismo de Clausius: My interpretation of Carathéodory’s thermodynamics did not have the effect I had hoped for of displacing the classical method which, in my opinion, is both clumsy and mathematically opaque. (Minha interpretação da termodinâmica de Carathéodory não obteve o efeito que eu esperava de substituir o método clássico que, na minha opinião, é desajeitado e matematicamente opaco.) (19 – p. 55) Após Born, possíveis empecilhos para com o uso e a divulgação do formalismo de Carathéodory foram investigados por diversos outros autores. Nesse contexto, além da aparente má sorte histórica que citamos, obstáculos pedagógicos e matemáticos que podem ter contribuído para a impopularidade do formalismo de Carathéodory foram apontados por Zemansky [20], em 1966. Zemansky escreveu que para a apresentação da segunda lei da termodinâmica: Due to the fact that Carathéodory’s axiom was not based directly on experience and that the proof of his theorem was longwinded and difficult, most physicists and textbook writers ignored the Carathéodory treatment […] (Devido ao fato de que o axioma de Carathéodory não era baseado diretamente da experiência e de que a prova do seu teorema era longa e difícil, a maioria dos físicos e escritores de livros-texto ignorou o tratamento de Carathéodory […]) (20 – p. 915) Curiosamente, anteriormente ao relato de Zemansky já haviam trabalhos que solucionavam as questões que ele apontava. Por exemplo, em 1964, Landsberg [21] provou que o axioma de Carathéodory pode ser deduzido do princípio de Kelvin. Esse resultado foi melhor investigado por Titulaer e Van Kampen [22] um ano depois, em 1965. Nesse mesmo ano, Dunning-Davies [23] provou a recíproca da conclusão de Landsberg, estabelecendo a equivalência entre o axioma de Carathéodory e o princípio de Kelvin. Então, mesmo que não seja baseado diretamente de fatos experimentais, o axioma de Carathéodory se mostrou equivalente ao princípio experimental de Kelvin, de forma que o axioma de Carathéodory pode ser visto como apenas outro enunciado da segunda lei da termodinâmica [14]. Por outro lado, o teorema de Carathéodory verificou-se demonstrável com argumentos curtos, relacionados a geometria do espaço termodinâmico [14, 17, 18], bem como, relacionados ao uso do conceito de campos vetoriais [7]. Essas demonstrações, no entanto, seguem um nível de simplicidade que não contempla todo o conteúdo matemático do teorema de Carathéodory na sua versão geral, como mostrou Boyling [24]. Todavia, para o ensino da termodinâmica clássica, as justificativas dadas pelos autores acima citados na demonstração desse teorema são, como propõem-se a ser, suficientes, e não prejudicam o seguimento dos resultados físicos da teoria [14]. Contudo, como já está claro, a superação desses dois empecilhos apontados por Zemansky ao formalismo de Carathéodory não bastou para fazer com que esse formalismo se difundisse posteriormente no meio da física. Mas então haveria alguma outra grande dificuldade, além daquelas originalmente apontadas por Zemansky, para com o uso do formalismo de Carathéodory? E em particular no âmbito da apresentação da segunda lei da termodinâmica? Defendemos com este artigo que não. E, assim, objetivamos introduzir alguns dos métodos e significados do formalismo de Carathéodory ao leitor, especificamente no contexto da apresentação da segunda lei da termodinâmica. Logo, nas seções seguintes, buscamos apresentar ao leitor, didaticamente, os esforços que citamos relacionados a conectar o axioma de Carathéodory com o princípio de Clausius e o princípio de Kelvin. Como um resultado novo a partir da ampla literatura revisada neste artigo, provamos a dedução direta do axioma de Carathéodory a partir do princípio de Clausius. A seção 3 trata da dedução do axioma de Carathéodory a partir do princípio de Kelvin, conforme Titulaer e Van Kampen [22]. Já a seção 4 trata da nossa dedução do axioma de Carathéodory a partir do princípio de Clausius. Consideramos serem essas etapas as mais importantes ao leitor no que se refere à conexão do formalismo de Carathéodory com a segunda lei da termodinâmica. Em seguida, procurando contribuir em alguma medida para com a popularização do formalismo de Carathéodory em cursos de termodinâmica clássica em nível de graduação, mostramos ao leitor na seção 5 um vislumbre de como a entropia e o conteúdo matemático da segunda lei da termodinâmica surgem como consequência direta da aplicação do teorema de Carathéodory. Para isso, o teorema de Carathéodory foi demonstrado na subseção 5.1 de forma simples, a partir do argumento de Born [17]. Já a entropia em si foi abordada logo após, na subseção 5.2. Também, para uma boa compreensão do que segue, basta ao leitor o conhecimento básico dos conceitos fundamentais da termodinâmica clássica: sistema e vizinhança; reservatório térmico, equilíbrio e espaço termodinâmico; coordenadas, estado e processos termodinâmicos; primeira e segunda lei da termodinâmica, etc. Porém, sempre que necessário, por uma questão de ênfase, faremos uma breve discussão de alguns desses conceitos. Por fim, este artigo não possui o intuito de defender a superioridade do formalismo de Carathéodory com relação aos outros formalismos da termodinâmica clássica. Portanto, tentamos aqui apenas indicar a possibilidade do uso do formalismo de Carathéodory no ensino da termodinâmica clássica. uma pequena discussão histórica sobre o contexto e os métodos do formalismo de Carathéodory. Mostramos também, nas seções 3 3. Axioma de Carathéodory a Partir do Princípio de Kelvin Existem algumas diferenças na literatura quanto à redação dos princípios experimentais da segunda lei da termodinâmica. Assim, mesmo que meramente relacionadas a uma escolha de palavras ligeiramente distintas por cada autor, essas diferenças podem causar confusões na interpretação dos enunciados desses princípios [25]. Buscando evitar essas situações, este artigo enunciará tanto o axioma de Carathéodory, quanto os princípios de Clausius e Kelvin, conforme encontra-se no livro clássico An Introduction to the Study of Stellar Structure, do ganhador do Nobel de Física de 1983, Subrahmanyan Chandrasekhar. Segue então o princípio de Kelvin, conforme Chandrasekhar [13]: In a cycle of processes it is impossible to transfer heat from a heat reservoir and convert it all into work, without at the same time transferring a certain amount of heat from a hotter to a colder body. (Em um ciclo de processos é impossível transferir calor de um reservatório térmico e convertê-lo totalmente em trabalho, sem ao mesmo tempo transferir uma certa quantidade de calor de um corpo mais quente para um mais frio.) ([13] – p. 24) O que o princípio de Kelvin – que se mencionará daqui em diante, de forma abreviada, por (K) – diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema converta totalmente calor 𝒬 absorvido de um reservatório térmico em trabalho W sem que, durante o mesmo ciclo, haja também calor cedido do sistema para outro sistema à temperatura mais baixa. Em outras palavras, seja 𝒬 o calor absorvido por um sistema a partir de um reservatório térmico durante um ciclo termodinâmico qualquer, e seja W o trabalho relacionado à interação do sistema com a sua vizinhança durante esse ciclo. Então, por (K), a seguinte igualdade ao final do ciclo é impossível, com 𝒬⊤′ (1) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Observe que (K) destacadamente trabalha com os conceitos de calor, trabalho, e temperatura, de forma a priori. Ou seja, nesse enunciado da segunda lei da termodinâmica, calor, trabalho, e temperatura, são conceitos termodinâmicas elementares. Entendido (K), segue o axioma de Carathéodory, também conforme Chandrasekhar [13]: Arbitrarily near to any given state there exist states which cannot be reached from an initial state by means of adiabatic processes. (Arbitrariamente próximo a qualquer estado existem estados que não podem ser alcançados a partir de um estado inicial por meio de processos adiabáticos.) ([13] – p. 24) Há muito para se comentar sobre o axioma de Carathéodory – que se mencionará daqui em diante, de forma abreviada, por (AC) – contudo, inicialmente, faz-se necessário o entendimento da palavra estado nesse contexto. A termodinâmica clássica lida com sistemas macroscópicos em situações de equilíbrio, ou seja, em situações em que as coordenadas, ou variáveis, termodinâmicas do sistema estão bem definidas. Com efeito, quando estabelecido o equilíbrio, analogamente ao caso da mecânica clássica, temos a caracterização completa do sistema termodinâmico pelo valor das suas coordenadas termodinâmicas independentes. E, quando isso é feito, o estado do sistema está definido e é expresso pelo conjunto dessas coordenadas termodinâmicas independentes que caracterizam o equilíbrio. Logo, para a termodinâmica clássica, situações de equilíbrio equivalem a definição do estado do sistema termodinâmico. Dito isso, vamos ao conteúdo de (AC). O que (AC) estabelece é que, dado um estado qualquer de um sistema termodinâmico, existirão outros estados que o sistema não pode alcançar por meio de processos adiabáticos. Processos adiabáticos são processos que ocorrem sem trocas de energia na forma de calor entre o sistema e a sua vizinhança. Observe que (AC) não faz distinção entre processos reversíveis ou irreversíveis. Perceba aqui que (AC) pressupõe como maior conceito termodinâmico elementar a noção de processo adiabático. Essa construção se faz presente no formalismo de Carathéodory com o objetivo de fugir do conceito direto de fluxo de calor, trocando-o pela ideia de processos não puramente mecânicos.4 Mas, para de fato entendermos o enunciado de (AC) precisamos analisar o significado do termo “alcançar” que nele consta. Para sair de um estado para outro, o sistema termodinâmico precisa realizar um processo e então chegar a uma nova situação de equilíbrio, configurando assim um novo estado termodinâmico. Dizer que existem estados que não podem ser “alcançados” por processos adiabáticos significa dizer que existem situações de equilíbrio que não podem ser obtidas se usarmos como caminho para isso um processo adiabático. Dito de outra forma, dado um estado qualquer de um sistema termodinâmico, não podemos submeter o sistema a processos adiabáticos arbitrários. Buscamos agora mostrar que (K) ⇒ (AC). Para isso é suficiente mostrarmos que se (AC) é falso, (K) também é.5 Então, conforme Titulaer e Van Kampen [22], provamos primeiro que (K) ⇒ (AC) para processos reversíveis. Processos reversíveis são, como o próprio nome sugere, processos passíveis de serem executados em ambas as “direções temporais”, uma vez que todas as situações do sistema durante esses processos são situações de equilíbrio. Por exemplo, se pudermos conceber um sistema constituído de um gás confinado em um recipiente limitado por um êmbolo móvel sem atrito, poderemos abaixar o êmbolo depositando grãos de areia um por um sobre ele, comprimindo assim o gás no recipiente de forma reversível, de modo que o gás sempre se manterá em equilíbrio nesse processo. Por outro lado, se retirarmos os grãos de areia de cima do êmbolo um a um, poderemos, em algum momento, retornar a exata mesma situação de equilíbrio que iniciamos esse raciocínio, retornando o gás ao seu estado termodinâmico original. Esse comportamento temporal reversível define os processos reversíveis. Por isso, processos reversíveis são representados por curvas contínuas no espaço termodinâmico. Assim, seja um espaço termodinâmico que define os estados termodinâmicos para um sistema termodinâmico modelo com um conjunto usual de três coordenadas termodinâmicas independentes: θ, a temperatura empírica do sistema, mensurada por algum instrumento de medida, em alguma escala de temperatura; x1 e x2, duas coordenadas relacionadas ao comportamento mecânico do sistema termodinâmico. Por exemplo, sendo x1 = V e x2 = M, respectivamente o volume e a magnitude da magnetização do sistema. A escolha por três coordenadas independentes para a caracterização do sistema termodinâmico modelo em discussão se faz, simplesmente, pela facilidade inicial de se trabalhar em três dimensões. No entanto, naturalmente, o que será argumentado a seguir vale também para um número maior de coordenadas termodinâmicas. Esse espaço termodinâmico, representado na Fig. 1, caracteriza um estado termodinâmico qualquer pelos valores mensurados das coordenadas (θ,x1,x2), por exemplo: (θ0,x10,x20). Por consequência, tal estado é univocamente identificado como um ponto A no referido espaço tal que, A=(θ0,x10,x20). Figura 1 Espaço termodinâmico das coordenadas θ, x1 e x2. Além disso, por estarmos tratando de sistemas termodinâmicos, sempre se faz possível a escolha da temperatura empírica como uma das coordenadas termodinâmicas independentes. Em seguida, seja 𝒫 o seguinte ciclo reversível dado no espaço termodinâmico da Fig. 1 e representado na Fig. 2. Figura 2 Ciclo reversível 𝒫 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. Uma vez que 𝒫 é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido A→B→B′→A. O ciclo reversível 𝒫 da Fig. 2 é montado de tal forma que: o processo A→B é supostamente adiabático, logo 𝒬A→B = 0; o processo B→B′ não foge da linha que preserva os valores de x1=x1* e x2=x2*, logo não há trabalho envolvido de B para B′, porém há calor absorvido 𝒬B→B′ > 0 de B para B′ graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo B′→A é também supostamente adiabático, logo 𝒬B′→A = 0. Isso fecha o ciclo 𝒫. Para esse ciclo que construímos é importante percebermos que, como 𝒫 é reversível, toda essa construção idealizada para 𝒫 poderia ser invertida, invertendo o ciclo e tomando ao contrário B′→B tal que, nesse sentido, haveria calor cedido 𝒬B′→B < 0 de B′ para B. Porém, um olhar mais cuidadoso sobre o ciclo 𝒫 que construímos revela que se ele for possível, então (AC) é falso. Com efeito, pode-se aproximar B′ de B de forma abitrária. Ademais, como 𝒫 é reversível, tanto o processo adiabático A→B quanto o processo adiabático A→B′ podem ser realizados. Mas, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′por processos adiabáticos reversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos reversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Mas como não temos até agora justificativas reais – físicas – para a validade de (AC), suponhamos que 𝒫 é de fato possível e então (AC) é mesmo falso. Vamos agora aplicar a primeira lei da termodinâmica em 𝒫. Isso nos fornece, graças à aditividade da energia (2) Δ ⁢ E 𝒫 = Δ ⁢ E A → B + Δ ⁢ E B → B ′ + Δ ⁢ E B ′ → A . Uma vez que 𝒫 é um ciclo termodinâmico, ΔE𝒫 = 0. Aplicando as características de 𝒫 em (2), temos (3) - W A → B + 𝒬 B → B ′ - W B ′ → A = 0 . Observe que as contribuições algébricas efetivas das quantidades de trabalho que aparecem em 𝒫 estão relacionadas à realização de trabalho do sistema na vizinhança, ou da vizinhança no sistema. Então, a expressão (3) pode ser reorganizada. Nomeando de W o trabalho efetivo envolvido no percurso de 𝒫, temos (4) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Mas isso é análogo ao que diz a equação (1) e assim a equação (4), que vem da hipótese de (AC) ser falso, falseia (K). Logo, para processos reversíveis (K) ⇒ (AC). Porém, sabemos que também lidamos com processos irreversíveis na termodinâmica clássica. Esses processos são, como o próprio nome sugere, processos que apenas podem ser realizados em uma única “direção temporal”, uma vez que as situações intermediárias do sistema em um processo irreversível não são situações de equilíbrio. Mesmo sendo a termodinâmica clássica uma teoria que estuda apenas as situações de equilíbrio, nela uma análise qualitativa dos processos irreversíveis é também possível. Isso se deve ao fato de que, na termodinâmica clássica, as situações iniciais e finais dos processos irreversíveis são sempre situações de equilíbrio. Além do mais, é dos processos irreversíveis que emerge o verdadeiro significado da entropia e da segunda lei da termodinâmica. Em termos do espaço termodinâmico, processos irreversíveis não podem ser representados como curvas contínuas usuais nesse espaço, ao contrário de como são os processos reversíveis. Assim, como apenas estão definidos os estados inicial e final de um processo irreversível, costuma-se representá-lo como uma linha tracejada no espaço termodinâmico, conectando os seus estados inicial e final. É natural que busquemos avaliar a relação (K) ⇒ (AC) também para processos irreversíveis. Assim, sejam os ciclos irreversíveis 𝒫1 e 𝒫2 no mesmo espaço termodinâmico anterior da Fig. 1, representados, respectivamente, na Fig. 3 e na Fig. 4. Figura 3 Ciclo irreversível 𝒫1 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B é irreversível. Logo, 𝒫1 só pode ser realizado no sentido A→B→B′→A. Figura 4 Ciclo irreversível 𝒫2 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B′ é irreversível. Logo, 𝒫2 só pode ser realizado no sentido A→B′→B→A. Os ciclos 𝒫1 e 𝒫2 são construídos de forma análoga aquela posta para o ciclo 𝒫 no caso reversível. No ciclo 𝒫1: o processo irreversível A→B é supostamente adiabático, então 𝒬A→B = 0; o processo reversível B→B′ se mantém na linha em que x1=x1* e x2=x2*, então WB→B′ = 0, porém 𝒬B→B′ > 0 graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo reversível B′→A é também supostamente adiabático, então 𝒬B′→A = 0. Isso fecha o ciclo 𝒫1. Deve-se destacar que graças à irreversibilidade de 𝒫1 o mesmo somente pode ser percorrido no sentido A→B→B′→A. Similarmente, no ciclo 𝒫2: o processo irreversível A→B′ é supostamente adiabático, então 𝒬A→B′ = 0; o processo reversível B′→B se mantém na linha em que x1=x1* e x2=x2*, então WB′→B = 0, porém 𝒬B′→B < 0 graças a diferença de temperatura entre B′ e B, θ∗−θ∗∗ < 0; por último, o processo reversível B→A é também supostamente adiabático, então 𝒬B→A = 0. Isso fecha o ciclo 𝒫2. Da mesma forma que para o ciclo 𝒫1, graças à irreversibilidade de 𝒫2 o mesmo somente pode ser percorrido no sentido A→B′→B→A. Agora, suponha que ambos os ciclos irreversíveis 𝒫1 e 𝒫2 sejam simultaneamente possíveis, ou seja, ambos os ciclos possam ser realizados. Ocorre que, se esse for o caso, então (AC) é falso. Com efeito, novamente, aproximamos B′ de B de forma arbitrária. Ademais, se supormos serem 𝒫1 e 𝒫2 simultaneamente possíveis, então como consequência ambos os processos irreversíveis A→B e A→B′ são também possíveis. Então, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′ por processos adiabáticos irreversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos irreversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, (AC) para processos irreversíveis. Nesse ponto, em comparação com o argumento do caso reversível, o leitor atento já deve ter percebido qual será o próximo passo que deve ser dado. Novamente, a princípio não temos nenhum argumento físico que impeça (AC) de ser falso no caso irreversível. Logo, suponha que (AC) é mesmo falso e então 𝒫1 e 𝒫2 são simultaneamente possíveis. Em seguida, repetindo o argumento do caso reversível e aplicando a primeira lei da termodinâmica tanto em 𝒫1 quanto em 𝒫2, temos que, ao final de cada um desses ciclos (5) 𝒬 ⁢ = ⁢ 𝒲. Na expressão (5) 𝒬 é o calor absorvido, ou cedido, pelo sistema em interação com um reservatório térmico apropriado para cada um dos ciclos, e W é o trabalho efetivo relacionado à s interações do sistema com a sua vizinhança também para cada um dos ciclos. Assumindo que 𝒫1 e 𝒫2 são simultaneamente possíveis, fica claro que uma igualdade análoga à expressão (5) poderia ser escrita para cada um desses ciclos irreversíveis: uma em que W = 𝒬⊤′ ao final do ciclo, relacionada com o ciclo 𝒫1, e uma em que W = 𝒬ℜ′ ao final do ciclo, relacionada com o ciclo 𝒫2. A primeira igualdade falseia (K), uma vez que ela exprimi exatamente o mesmo conteúdo da expressão (1), que é proibida por (K). Logo, para processos irreversíveis (K) ⇒ (AC). Uma argumentação direta para essa conclusão pode ser encontrada no capítulo 5 do livro do Landsberg [15]. Algumas considerações devem ser feitas sobre esse resultado. Observe que a verdadeira fenomenologia por trás de (K) em conexão com (AC) apenas é revelada a partir do estudo dos processos irreversíveis. Já que, se (K) tratasse da impossibilidade de ao final de um ciclo termos W = 𝒬ℜ′, ao invés de W = 𝒬⊤′, nada seria alterado na nossa análise do caso reversível para mostrarmos que (K) ⇒ (AC). A retirada dessa aparente ambiguidade matemática do estudo reversível de (K) apenas ocorre com a análise dos processos irreversíveis, revelando o verdadeiro caráter físico de (K). Para evitar nos estendermos em demasia nessa discussão, a argumentação quanto a recíproca dessa relação entre (AC) e (K) não será apresentada aqui; porém, ela é curta, e pode ser consultada no artigo de Dunning-Davies [23]. , 4 4. Axioma de Carathéodory a Partir do Princípio de Clausius Apresentamos agora nossa prova da dedução do axioma de Carathéodory a partir do princípio de Clausius. Igualmente como foi feito na seção anterior, estabelecemos o princípio de Clausius, conforme Chandrasekhar [13]: It is impossible that, at the end of a cycle of changes, heat has been transferred from a colder to a hotter body without at the same time converting a certain amount of work into heat. (É impossível que, ao final de um ciclo de mudanças, calor tenha sido transferido de um corpo mais frio para um corpo mais quente sem que ao mesmo tempo se converta uma certa quantidade de trabalho em calor.) ([13] – p. 24) Busquemos realizar uma análise semelhante para o princípio de Clausius – que se mencionará daqui em diante, de forma abreviada, por (C) – daquela que fizemos para (K) na seção anterior. O que (C) diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema absorva uma certa quantidade de calor 𝒬 de um corpo a uma temperatura mais baixa que a do sistema e, em seguida, transfira integralmente essa mesma quantidade de calor 𝒬 para um corpo a uma temperatura mais alta que a do sistema, sem que, durante esse ciclo, haja a conversão de alguma quantidade de trabalho W em calor adicional. Aqui, os corpos mencionados, cujo sistema entra em contato no ciclo descrito, são corpos que preservam as suas respectivas temperaturas quando interagem com o sistema. Isso torna implícito que esses corpos em contato com o sistema que realiza o ciclo são reservatórios térmicos. Então, no esquema do princípio de Clausius, temos um reservatório térmico com uma temperatura mais baixa que a temperatura do sistema, e um reservatório térmico com uma temperatura mais alta que a temperatura do sistema. Esses reservatórios térmicos estudados costumeiramente recebem o sugestivo nome de fontes térmicas; fonte fria para o reservatório térmico sob temperatura mais baixa que a do sistema, e fonte quente para o reservatório térmico sob temperatura mais alta que a do sistema. Ou seja, suponha que um sistema descreve um ciclo termodinâmico que absorve uma certa quantidade de calor 𝒬f de uma fonte fria, e então rejeita uma outra certa quantidade de calor 𝒬q para uma fonte quente, sem que haja nesse ciclo qualquer realização de trabalho efetivo para que seja convertido em calor adicional. Por (C), a seguinte igualdade ao final do ciclo é impossível (6) | 𝒬 f | = | 𝒬 q | . Isto é, ao final do ciclo não podemos ter a igualdade entre as magnitudes das quantidades de calor que foram absorvidas e rejeitadas, respectivamente, da fonte fria, e para a fonte quente. Em (6) devemos escrever o módulo das quantidades de calor no ciclo, pois, em função da interação com o sistema, calor rejeitado para uma fonte é, naturalmente, algebricamente negativo. Assim, já familiarizados com o conteúdo de (AC), desejamos mostrar que (C) ⇒ (AC). Como antes, para isso é suficiente mostrarmos que se (AC) é falso, (C) também é. Vamos mostrar uma prova para essa relação primeiramente para processos reversíveis. Então, seja primeiro 𝒫′ o ciclo reversível representado na Fig. 5 e dado no mesmo espaço termodinâmico que já estamos habituados a trabalhar, para o mesmo sistema termodinâmico modelo anteriormente utilizado. Observe que 𝒫′ percorre o ciclo de pontos B→C→D→A→B no espaço termodinâmico. O trecho A→B′→B e o ciclo 𝒫″ que percorre os pontos B′→B→C→D→A→B′, a princípio não fazem parte do que estamos considerando na Fig. 5. Figura 5 Ciclo reversível 𝒫′ construído através de processos intermediários entre os pontos A, B, C e D no espaço termodinâmico. Uma vez que 𝒫′ é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido B→C→D→A→B. O trecho A→B′→B será discutido posteriormente. Construímos o ciclo reversível 𝒫′ da Fig. 5, percorrendo o ciclo de pontos B→C→D→A→B, de modo que o sistema descreve, durante 𝒫′: o processo B→C, cuja temperatura θ∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a absorção de uma certa quantidade de calor 𝒬B→C > 0 do sistema a partir da vizinhança; o processo C→D, que é supostamente adiabático, logo 𝒬C→D = 0; o processo D→A, cuja temperatura θ∗∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a rejeição de uma certa quantidade de calor 𝒬B→C < 0 do sistema para a vizinhança; por fim, o processo A→B, que é também supostamente adiabático, logo 𝒬A→B = 0. Isso fecha o ciclo 𝒫′. Aqui, algumas considerações importantes devem ser notadas: i) a princípio nada impede que um ciclo como 𝒫′ seja construído, ii) em geral durante 𝒫′ temos |𝒬B→C|≠|𝒬D→A|, com trabalho efetivo sendo convertido em calor adicional, iii) os processos intermediários B→C e D→A de 𝒫′, ao preservarem a temperatura do sistema em contato com a sua vizinhança, indicam que durante esses processos o sistema está em contato com fontes térmicas, sendo que naturalmente a fonte fria é aquela à temperatura θ∗ e a fonte quente é aquela à temperatura θ∗∗, e iv) como 𝒫′ é reversível, toda essa construção idealizada para 𝒫′ poderia ser invertida, invertendo o ciclo e tomando ao contrário uma absorção de calor da fonte quente, e uma rejeição de calor para a fonte fria. Em seguida, notamos o ciclo 𝒫″, que pode também ser visto na Fig. 5 e percorre o ciclo de pontos B′→B→C→D→A→B′ no espaço termodinâmico. Em 𝒫″ o ponto B′ foi escolhido de tal modo que tenhamos |𝒬B′→C| = |𝒬D→A| durante a realização de 𝒫″, com o processo intermediário A→B′ também supostamente adiabático. Dada a possibilidade irrestrita da ocorrência de 𝒫′, se for também verdade que 𝒫″ é possível nos moldes do que foi construído, então significa que os processos adiabáticos A→B′ e A→B são simultaneamente possíveis. Entretanto, se A→B′ e A→B forem simultaneamente possíveis, então (AC) é falso. De fato, podemos aproximar B′ de B de forma arbitrária. E, se supormos 𝒫″ possível, os processos adiabáticos reversíveis A→B′ e A→B se tornam simultaneamente possíveis. Se também aproximarmos arbitrariamente a linha de pontos no espaço termodinâmico cuja temperatura é θ∗, da linha de pontos cuja temperatura é θ∗∗, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Contudo, podemos ver que se assumirmos a falsidade de (AC), a execução de 𝒫″ nos dá de imediato a falsidade de (C). Com efeito, se (AC) é falso então A→B′ e A→B são simultaneamente possíveis, em particular 𝒫″ é possível, e como consequência durante 𝒫″ (7) | 𝒬 B ′ → C | = | 𝒬 D → A | . O que fornece, pela expressão (7), o mesmo que a expressão (6), que é proibida por (C). Logo, para processos reversíveis (C) ⇒ (AC). Espera-se naturalmente que (C) ⇒ (AC) também para o caso irreversível. De fato, uma argumentação quanto a validade da relação (C) ⇒ (AC) para processos irreversíveis se dá de forma natural a partir do que já foi mostrado com a análise análoga de que (K) ⇒ (AC) para o caso irreversível. Para essa argumentação seria necessária a construção de dois ciclos irreversíveis semelhantes a 𝒫′ e 𝒫″, tais que naquele análogo a 𝒫′ o processo A→B seria supostamente adiabático e irreversível, e naquele análogo a 𝒫″ o processo A→B′ seria supostamente adiabático e irreversível. Os outros processos desses ciclos seriam reversíveis. Em seguida, tomaríamos a hipótese de serem esses ciclos irreversíveis construídos simultaneamente possíveis. Assim, repetindo a mesma análise e verificando conclusões similares aquelas obtidas no caso irreversível da relação (K) ⇒ (AC), mostraríamos que, para não violar (C), (AC) também é verdadeiro para processos irreversíveis. Para evitar a repetição desses mesmos passos e das mesmas argumentações já feitas anteriormente, o que tornaria desnecessariamente maçante a discussão aqui realizada, essa etapa não será desenvolvida no presente artigo. , e 5 5. Caminho Para a Entropia Agora, munidos da validade do axioma de Carathéodory, deduzido dos princípios de Clausius e Kelvin nas seções anteriores, e do conteúdo do teorema de Carathéodory, que veremos a seguir, mostraremos como obter a entropia e o conteúdo matemático da segunda lei da termodinâmica a partir do formalismo de Carathéodory. Com esse objetivo em mente, precisaremos antes falar um pouco de alguns aspectos formais do formalismo de Carathéodory. Buscando aliar detalhamento, fluidez e caráter didático na presente seção, a dividimos em duas subseções: uma, a 5.1, para tratar da matemática em si e do teorema usado no formalismo de Carathéodory, e outra, a 5.2, para tratar de um caminho6 possível para a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica por esse formalismo. 5.1. Requisitos matemáticos e teorema deCarathéodory O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [14], que caracterizam um sistema mecânico. Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas. E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é (8) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i . A análise cuidadosa da expressão (8) é crucial para o que segue7. O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ∗ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata. Se a quantidade δχ∗ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ∗ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos (9) d ⁢ χ * = ∑ i = 1 n ∂ ⁡ χ * ∂ ⁡ x i ⁢ d ⁢ x i . Isto é, nesse caso as χi são as derivadas parciais de χ∗ em relação as coordenadas termodinâmicas xi e a função de estado χ∗ pode ser obtida via uma integração comum9 desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ∗ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ∗ em (8), se (10) ∂ ⁡ χ k ∂ ⁡ x l = ∂ ⁡ χ l ∂ ⁡ x k com ( k , l = 1 , 2 , … , n ) . O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ∗ será uma diferencial exata. Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando (11) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Para a equação definida em (11) damos aqui o nome10 de equação diferencial associada a δχ∗. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ∗ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ∗ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ∗ = 0 é, a partir da equação (11) (12) χ * = χ * ⁢ ( x 1 , x 2 , … , x n ) = c . Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ∗(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ∗(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ∗(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação. Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ∗ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação (13) d ⁢ σ = μ ⁢ δ ⁢ η . Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata dσ. Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory. Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [14]: If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation ∑i=1nχi⁢(xj)⁢d⁢xi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação ∑i=1nχi⁢(xj)⁢d⁢xi=0, então a equação é integrável.) ([14] – p. 62) Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 e 4. Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos (14) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i . Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por (15) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável. Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12: Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos. E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica. Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo: Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável. O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [17]. Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13, Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter dσ = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e dσ devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que (16) d ⁢ σ = μ ⁢ δ ⁢ 𝒬 . ■ Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais dσ e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre dσ e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e dσ, ao invés da equação (16), a seguinte expressão (17) δ ⁢ 𝒬 = μ ⁢ d ⁢ σ . Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos. 5.2. Entropia e temperatura absoluta Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca. Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos (18) δ ⁢ 𝒬 C = δ ⁢ 𝒬 A + δ ⁢ 𝒬 B . Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato (19) μ C ⁢ d ⁢ σ C = μ A ⁢ d ⁢ σ A + μ B ⁢ d ⁢ σ B . Reorganizando (19) em termos de dσC, obtemos (20) d ⁢ σ C = μ A μ C ⁢ d ⁢ σ A + μ B μ C ⁢ d ⁢ σ B . Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever (21) d ⁢ σ C = ∂ ⁡ σ C ∂ ⁡ σ A ⁢ d ⁢ σ A + ∂ ⁡ σ C ∂ ⁡ σ B ⁢ d ⁢ σ B . Tal que, comparando as expressões (21) e (20), temos (22a) μ A μ C = ∂ ⁡ σ C ∂ ⁡ σ A ; (22b) μ B μ C = ∂ ⁡ σ C ∂ ⁡ σ B . As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que (23a) μ A μ C = μ A μ C ⁢ ( σ A , σ B ) ; (23b) μ B μ C = μ B μ C ⁢ ( σ A , σ B ) . Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB (24a) μ A = μ A ⁢ ( x 1 , x 2 , … , x n - 1 , σ A , θ ) ; (24b) μ B = μ B ⁢ ( y 1 , y 2 , … , y n - 1 , σ B , θ ) ; (24c) μ C = μ C ⁢ ( x 1 , … , x n - 1 , y 1 , … , y n - 1 , σ A , σ B , θ ) . Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 (25a) μ A = μ A ⁢ ( σ A , θ ) = t ⁢ ( θ ) ⁢ f A ⁢ ( σ A ) ; (25b) μ B = μ B ⁢ ( σ B , θ ) = t ⁢ ( θ ) ⁢ f B ⁢ ( σ B ) ; (25c) μ C = μ C ⁢ ( σ A , σ B , θ ) = t ⁢ ( θ ) ⁢ f C ⁢ ( σ A , σ B ) . Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB. O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [28], a menos de uma constante arbitrária k, de modo que (26) T = k ⁢ t ⁢ ( θ ) . O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [14]. Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer (27) δ ⁢ 𝒬 = T k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Isolando os termos de (27) com a dependência em σ (28) δ ⁢ 𝒬 T = 1 k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos (29) d ⁢ 𝒮 ≡ ∞ ∥ ⁢ { ⁢ ⇐ ⁢ σ ⁢ ⇒ ⁢ ⌈ ⁢ σ ⁢ . A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos (30) d ⁢ 𝒮 ⁢ = ⁢ δ ⁢ 𝒬 𝒯 ⁢ . A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis. Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫⇓ e 𝒫↖, partindo ambos do mesmo ponto arbitrário A. Figura 6 Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫⇓ de A→B′, e 𝒫↖ de A→B. Feito isso, suponha ambos esses processos, 𝒫⇓ e 𝒫↖, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫⇓, negativa durante 𝒫↖. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫⇓ e 𝒫↖ simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis. Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [28]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos (31) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ > 0 . A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos (32) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ ⩾ 0 . A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica. Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [14]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [29]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs. , como o formalismo de Carathéodory se conecta com um dos resultados mais importantes da termodinâmica clássica: a segunda lei da termodinâmica, formulada a partir dos princípios de Clausius e Kelvin.

2. Formalismo de Carathéodory

Em um artigo de 1909 publicado no Mathematische Annalen, o matemático Constantin Carathéodory [1010. C. Carathéodory, Math. Ann. 67, 355 (1909).], propôs um formalismo para a termodinâmica clássica que obtinha os resultados da teoria3 3 A totalidade dos resultados esperados da termodinâmica não surge do formalismo de Carathéodory. O mesmo é também verdade para o formalismo de Clausius. O maior exemplo disso é a terceira lei da termodinâmica, cujo conteúdo preciso e completo somente pode ser obtido pelo advento da mecânica quântica. Sem essa inclusão, ambos os formalismos produzem o conteúdo da terceira lei da termodinâmica de forma ad hoc. Nesse sentido, podemos dizer que esses formalismo nos fornecem aquilo que seria esperado como o conteúdo matemático clássico da teoria. Para mais detalhes quanto a esse assunto, sugerimos ao leitor a consulta do livro de Tisza [11]. a partir de dois axiomas, um para a primeira lei, e outro para a segunda lei da termodinâmica, de forma que o desenvolvimento dos conceitos termodinâmicos se dava em termos de considerações oriundas de conceitos mecânicos.

O axioma usado por Carathéodory para a segunda lei da termodinâmica foi a maior novidade do seu trabalho. Esse axioma não era baseado em experimentos, não obstante, dele emergiam a entropia e o seu conteúdo matemático clássico. Apesar desse axioma ser eventualmente conhecido como o segundo axioma de Carathéodory [1212. F.W. Sears, Am J Phys 34, 665 (1966).], dada a existência de um axioma de Carathéodory também para a primeira lei da termodinâmica, nosso maior foco aqui é o estudo em particular da segunda lei da termodinâmica. Por esse motivo, doravante iremos nos referir ao axioma de Carathéodory para a segunda lei da termodinâmica apenas como axioma de Carathéodory.

Vários autores se dedicaram à missão de disseminar as ideias de Carathéodory ao longo dos anos, a saber: Sears [1212. F.W. Sears, Am J Phys 34, 665 (1966).], Chandrasekhar [1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).], Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).], Landsberg [1515. P.T. Landsberg, Thermodynamics and Statistical Mechanics (Dover Publications, New York, 2014).], Dunning-Davies [1616. J. Dunning-Davies, Concise Thermodynamics: Principles and Applications in Physical Science and Engineering (Woodhead Publishing Limited, Sawston, 2007), 2ª ed.], entre outros. Em especial, Max Born, um dos físicos precursores da mecânica quântica, defendeu a visão de Carathéodory durante uma grande parte da sua vida. Com publicações [1717. M. Born, Physik. Z. 22, 282 (1921)., 1818. M. Born, Natural Philosophy of Cause and Chance (Clarendon Press, Oxford, 1949).] e também com duras críticas ao formalismo de Clausius, Born buscou popularizar o formalismo de Carathéodory ao dizer, por exemplo, em um artigo de 1921:

a) Não existe nenhuma outra área da física onde são aplicadas considerações que tenham qualquer semelhança com o ciclo de Carnot e correlatos. b) Tem-se que admitir que a termodinâmica, no seu modelo tradicional, ainda não realizou o ideal lógico da separação entre o conteúdo físico e a descrição matemática. c) É preciso fazer uma remoção de entulhos, que uma tradição cheia de piedade demais até aqui, não ousou remover.

[ênfase do autor][1717. M. Born, Physik. Z. 22, 282 (1921).]

Em correspondência a Einstein [1919. M. Born, A. Einstein e H. Born, The Born-Einstein Letters (The MacMillan Press, London, 1971).], exatamente sobre essa publicação [1717. M. Born, Physik. Z. 22, 282 (1921).] que submetia ao atual Physikalische Zeitschrift, Born escreveu:

Frankfurt a.M.

12 February, 1921

Dear Einstein …I have done little theoretical work. I have recently written an account of Carathéodory’s thermodynamics, which will appear shortly in the Physikalische Zeitung. I am very curious to know what you will say about it.

Frankfurt a.M.

12 Fevereiro, 1921

(Prezado Einstein …Tenho feito pouco trabalho teórico. Recentemente escrevi uma exposição da termodinâmica de Carathéodory, a qual irá aparecer em breve no Physikalische Zeitung. Estou muito curioso para saber o que você dirá a respeito.)

(1919. M. Born, A. Einstein e H. Born, The Born-Einstein Letters (The MacMillan Press, London, 1971). – p. 53)

Já havendo publicado os trabalhos que elevariam seu nome ao patamar de um dos maiores da história da ciência – sobre a relatividade e o efeito fotoelétrico –, um retorno positivo de Einstein a respeito do formalismo de Carathéodory com certeza poderia ter proporcionado a esse assunto uma recepção diferente da comunidade da física. Mas, apesar da solicitação de Born, não constam nas posteriores correspondências entre Born e Einstein [1919. M. Born, A. Einstein e H. Born, The Born-Einstein Letters (The MacMillan Press, London, 1971).] qualquer menção desse último a questão do trabalho de Carathéodory. Posteriormente, e ainda sobre a sua tentativa de popularizar o trabalho de Carathéodory, a frustração de Born se confirma quando ele afirma, se referindo por método clássico ao que chamamos aqui de formalismo de Clausius:

My interpretation of Carathéodory’s thermodynamics did not have the effect I had hoped for of displacing the classical method which, in my opinion, is both clumsy and mathematically opaque.

(Minha interpretação da termodinâmica de Carathéodory não obteve o efeito que eu esperava de substituir o método clássico que, na minha opinião, é desajeitado e matematicamente opaco.)

(1919. M. Born, A. Einstein e H. Born, The Born-Einstein Letters (The MacMillan Press, London, 1971). – p. 55)

Após Born, possíveis empecilhos para com o uso e a divulgação do formalismo de Carathéodory foram investigados por diversos outros autores. Nesse contexto, além da aparente má sorte histórica que citamos, obstáculos pedagógicos e matemáticos que podem ter contribuído para a impopularidade do formalismo de Carathéodory foram apontados por Zemansky [2020. M.W. Zemansky, Am J Phys 34, 914 (1966).], em 1966. Zemansky escreveu que para a apresentação da segunda lei da termodinâmica:

Due to the fact that Carathéodory’s axiom was not based directly on experience and that the proof of his theorem was longwinded and difficult, most physicists and textbook writers ignored the Carathéodory treatment […]

(Devido ao fato de que o axioma de Carathéodory não era baseado diretamente da experiência e de que a prova do seu teorema era longa e difícil, a maioria dos físicos e escritores de livros-texto ignorou o tratamento de Carathéodory […])

(2020. M.W. Zemansky, Am J Phys 34, 914 (1966). – p. 915)

Curiosamente, anteriormente ao relato de Zemansky já haviam trabalhos que solucionavam as questões que ele apontava. Por exemplo, em 1964, Landsberg [2121. P.T. Landsberg, Nature 201, 485 (1964).] provou que o axioma de Carathéodory pode ser deduzido do princípio de Kelvin. Esse resultado foi melhor investigado por Titulaer e Van Kampen [2222. U.M. Titulaer e N.G. Van Kampen, Physica 31, 1029 (1965).] um ano depois, em 1965. Nesse mesmo ano, Dunning-Davies [2323. J. Dunning-Davies, Nature 208, 576 (1965).] provou a recíproca da conclusão de Landsberg, estabelecendo a equivalência entre o axioma de Carathéodory e o princípio de Kelvin. Então, mesmo que não seja baseado diretamente de fatos experimentais, o axioma de Carathéodory se mostrou equivalente ao princípio experimental de Kelvin, de forma que o axioma de Carathéodory pode ser visto como apenas outro enunciado da segunda lei da termodinâmica [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).].

Por outro lado, o teorema de Carathéodory verificou-se demonstrável com argumentos curtos, relacionados a geometria do espaço termodinâmico [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966)., 1717. M. Born, Physik. Z. 22, 282 (1921)., 1818. M. Born, Natural Philosophy of Cause and Chance (Clarendon Press, Oxford, 1949).], bem como, relacionados ao uso do conceito de campos vetoriais [77. J.H. Luscombe, Thermodynamics (CRC Press, Boca Raton, 2018).]. Essas demonstrações, no entanto, seguem um nível de simplicidade que não contempla todo o conteúdo matemático do teorema de Carathéodory na sua versão geral, como mostrou Boyling [2424. J.B. Boyling, Comm. Math. Phys. 10, 52 (1968).]. Todavia, para o ensino da termodinâmica clássica, as justificativas dadas pelos autores acima citados na demonstração desse teorema são, como propõem-se a ser, suficientes, e não prejudicam o seguimento dos resultados físicos da teoria [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).].

Contudo, como já está claro, a superação desses dois empecilhos apontados por Zemansky ao formalismo de Carathéodory não bastou para fazer com que esse formalismo se difundisse posteriormente no meio da física. Mas então haveria alguma outra grande dificuldade, além daquelas originalmente apontadas por Zemansky, para com o uso do formalismo de Carathéodory? E em particular no âmbito da apresentação da segunda lei da termodinâmica? Defendemos com este artigo que não. E, assim, objetivamos introduzir alguns dos métodos e significados do formalismo de Carathéodory ao leitor, especificamente no contexto da apresentação da segunda lei da termodinâmica.

Logo, nas seções seguintes, buscamos apresentar ao leitor, didaticamente, os esforços que citamos relacionados a conectar o axioma de Carathéodory com o princípio de Clausius e o princípio de Kelvin. Como um resultado novo a partir da ampla literatura revisada neste artigo, provamos a dedução direta do axioma de Carathéodory a partir do princípio de Clausius. A seção 3 3. Axioma de Carathéodory a Partir do Princípio de Kelvin Existem algumas diferenças na literatura quanto à redação dos princípios experimentais da segunda lei da termodinâmica. Assim, mesmo que meramente relacionadas a uma escolha de palavras ligeiramente distintas por cada autor, essas diferenças podem causar confusões na interpretação dos enunciados desses princípios [25]. Buscando evitar essas situações, este artigo enunciará tanto o axioma de Carathéodory, quanto os princípios de Clausius e Kelvin, conforme encontra-se no livro clássico An Introduction to the Study of Stellar Structure, do ganhador do Nobel de Física de 1983, Subrahmanyan Chandrasekhar. Segue então o princípio de Kelvin, conforme Chandrasekhar [13]: In a cycle of processes it is impossible to transfer heat from a heat reservoir and convert it all into work, without at the same time transferring a certain amount of heat from a hotter to a colder body. (Em um ciclo de processos é impossível transferir calor de um reservatório térmico e convertê-lo totalmente em trabalho, sem ao mesmo tempo transferir uma certa quantidade de calor de um corpo mais quente para um mais frio.) ([13] – p. 24) O que o princípio de Kelvin – que se mencionará daqui em diante, de forma abreviada, por (K) – diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema converta totalmente calor 𝒬 absorvido de um reservatório térmico em trabalho W sem que, durante o mesmo ciclo, haja também calor cedido do sistema para outro sistema à temperatura mais baixa. Em outras palavras, seja 𝒬 o calor absorvido por um sistema a partir de um reservatório térmico durante um ciclo termodinâmico qualquer, e seja W o trabalho relacionado à interação do sistema com a sua vizinhança durante esse ciclo. Então, por (K), a seguinte igualdade ao final do ciclo é impossível, com 𝒬⊤′ (1) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Observe que (K) destacadamente trabalha com os conceitos de calor, trabalho, e temperatura, de forma a priori. Ou seja, nesse enunciado da segunda lei da termodinâmica, calor, trabalho, e temperatura, são conceitos termodinâmicas elementares. Entendido (K), segue o axioma de Carathéodory, também conforme Chandrasekhar [13]: Arbitrarily near to any given state there exist states which cannot be reached from an initial state by means of adiabatic processes. (Arbitrariamente próximo a qualquer estado existem estados que não podem ser alcançados a partir de um estado inicial por meio de processos adiabáticos.) ([13] – p. 24) Há muito para se comentar sobre o axioma de Carathéodory – que se mencionará daqui em diante, de forma abreviada, por (AC) – contudo, inicialmente, faz-se necessário o entendimento da palavra estado nesse contexto. A termodinâmica clássica lida com sistemas macroscópicos em situações de equilíbrio, ou seja, em situações em que as coordenadas, ou variáveis, termodinâmicas do sistema estão bem definidas. Com efeito, quando estabelecido o equilíbrio, analogamente ao caso da mecânica clássica, temos a caracterização completa do sistema termodinâmico pelo valor das suas coordenadas termodinâmicas independentes. E, quando isso é feito, o estado do sistema está definido e é expresso pelo conjunto dessas coordenadas termodinâmicas independentes que caracterizam o equilíbrio. Logo, para a termodinâmica clássica, situações de equilíbrio equivalem a definição do estado do sistema termodinâmico. Dito isso, vamos ao conteúdo de (AC). O que (AC) estabelece é que, dado um estado qualquer de um sistema termodinâmico, existirão outros estados que o sistema não pode alcançar por meio de processos adiabáticos. Processos adiabáticos são processos que ocorrem sem trocas de energia na forma de calor entre o sistema e a sua vizinhança. Observe que (AC) não faz distinção entre processos reversíveis ou irreversíveis. Perceba aqui que (AC) pressupõe como maior conceito termodinâmico elementar a noção de processo adiabático. Essa construção se faz presente no formalismo de Carathéodory com o objetivo de fugir do conceito direto de fluxo de calor, trocando-o pela ideia de processos não puramente mecânicos.4 Mas, para de fato entendermos o enunciado de (AC) precisamos analisar o significado do termo “alcançar” que nele consta. Para sair de um estado para outro, o sistema termodinâmico precisa realizar um processo e então chegar a uma nova situação de equilíbrio, configurando assim um novo estado termodinâmico. Dizer que existem estados que não podem ser “alcançados” por processos adiabáticos significa dizer que existem situações de equilíbrio que não podem ser obtidas se usarmos como caminho para isso um processo adiabático. Dito de outra forma, dado um estado qualquer de um sistema termodinâmico, não podemos submeter o sistema a processos adiabáticos arbitrários. Buscamos agora mostrar que (K) ⇒ (AC). Para isso é suficiente mostrarmos que se (AC) é falso, (K) também é.5 Então, conforme Titulaer e Van Kampen [22], provamos primeiro que (K) ⇒ (AC) para processos reversíveis. Processos reversíveis são, como o próprio nome sugere, processos passíveis de serem executados em ambas as “direções temporais”, uma vez que todas as situações do sistema durante esses processos são situações de equilíbrio. Por exemplo, se pudermos conceber um sistema constituído de um gás confinado em um recipiente limitado por um êmbolo móvel sem atrito, poderemos abaixar o êmbolo depositando grãos de areia um por um sobre ele, comprimindo assim o gás no recipiente de forma reversível, de modo que o gás sempre se manterá em equilíbrio nesse processo. Por outro lado, se retirarmos os grãos de areia de cima do êmbolo um a um, poderemos, em algum momento, retornar a exata mesma situação de equilíbrio que iniciamos esse raciocínio, retornando o gás ao seu estado termodinâmico original. Esse comportamento temporal reversível define os processos reversíveis. Por isso, processos reversíveis são representados por curvas contínuas no espaço termodinâmico. Assim, seja um espaço termodinâmico que define os estados termodinâmicos para um sistema termodinâmico modelo com um conjunto usual de três coordenadas termodinâmicas independentes: θ, a temperatura empírica do sistema, mensurada por algum instrumento de medida, em alguma escala de temperatura; x1 e x2, duas coordenadas relacionadas ao comportamento mecânico do sistema termodinâmico. Por exemplo, sendo x1 = V e x2 = M, respectivamente o volume e a magnitude da magnetização do sistema. A escolha por três coordenadas independentes para a caracterização do sistema termodinâmico modelo em discussão se faz, simplesmente, pela facilidade inicial de se trabalhar em três dimensões. No entanto, naturalmente, o que será argumentado a seguir vale também para um número maior de coordenadas termodinâmicas. Esse espaço termodinâmico, representado na Fig. 1, caracteriza um estado termodinâmico qualquer pelos valores mensurados das coordenadas (θ,x1,x2), por exemplo: (θ0,x10,x20). Por consequência, tal estado é univocamente identificado como um ponto A no referido espaço tal que, A=(θ0,x10,x20). Figura 1 Espaço termodinâmico das coordenadas θ, x1 e x2. Além disso, por estarmos tratando de sistemas termodinâmicos, sempre se faz possível a escolha da temperatura empírica como uma das coordenadas termodinâmicas independentes. Em seguida, seja 𝒫 o seguinte ciclo reversível dado no espaço termodinâmico da Fig. 1 e representado na Fig. 2. Figura 2 Ciclo reversível 𝒫 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. Uma vez que 𝒫 é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido A→B→B′→A. O ciclo reversível 𝒫 da Fig. 2 é montado de tal forma que: o processo A→B é supostamente adiabático, logo 𝒬A→B = 0; o processo B→B′ não foge da linha que preserva os valores de x1=x1* e x2=x2*, logo não há trabalho envolvido de B para B′, porém há calor absorvido 𝒬B→B′ > 0 de B para B′ graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo B′→A é também supostamente adiabático, logo 𝒬B′→A = 0. Isso fecha o ciclo 𝒫. Para esse ciclo que construímos é importante percebermos que, como 𝒫 é reversível, toda essa construção idealizada para 𝒫 poderia ser invertida, invertendo o ciclo e tomando ao contrário B′→B tal que, nesse sentido, haveria calor cedido 𝒬B′→B < 0 de B′ para B. Porém, um olhar mais cuidadoso sobre o ciclo 𝒫 que construímos revela que se ele for possível, então (AC) é falso. Com efeito, pode-se aproximar B′ de B de forma abitrária. Ademais, como 𝒫 é reversível, tanto o processo adiabático A→B quanto o processo adiabático A→B′ podem ser realizados. Mas, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′por processos adiabáticos reversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos reversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Mas como não temos até agora justificativas reais – físicas – para a validade de (AC), suponhamos que 𝒫 é de fato possível e então (AC) é mesmo falso. Vamos agora aplicar a primeira lei da termodinâmica em 𝒫. Isso nos fornece, graças à aditividade da energia (2) Δ ⁢ E 𝒫 = Δ ⁢ E A → B + Δ ⁢ E B → B ′ + Δ ⁢ E B ′ → A . Uma vez que 𝒫 é um ciclo termodinâmico, ΔE𝒫 = 0. Aplicando as características de 𝒫 em (2), temos (3) - W A → B + 𝒬 B → B ′ - W B ′ → A = 0 . Observe que as contribuições algébricas efetivas das quantidades de trabalho que aparecem em 𝒫 estão relacionadas à realização de trabalho do sistema na vizinhança, ou da vizinhança no sistema. Então, a expressão (3) pode ser reorganizada. Nomeando de W o trabalho efetivo envolvido no percurso de 𝒫, temos (4) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Mas isso é análogo ao que diz a equação (1) e assim a equação (4), que vem da hipótese de (AC) ser falso, falseia (K). Logo, para processos reversíveis (K) ⇒ (AC). Porém, sabemos que também lidamos com processos irreversíveis na termodinâmica clássica. Esses processos são, como o próprio nome sugere, processos que apenas podem ser realizados em uma única “direção temporal”, uma vez que as situações intermediárias do sistema em um processo irreversível não são situações de equilíbrio. Mesmo sendo a termodinâmica clássica uma teoria que estuda apenas as situações de equilíbrio, nela uma análise qualitativa dos processos irreversíveis é também possível. Isso se deve ao fato de que, na termodinâmica clássica, as situações iniciais e finais dos processos irreversíveis são sempre situações de equilíbrio. Além do mais, é dos processos irreversíveis que emerge o verdadeiro significado da entropia e da segunda lei da termodinâmica. Em termos do espaço termodinâmico, processos irreversíveis não podem ser representados como curvas contínuas usuais nesse espaço, ao contrário de como são os processos reversíveis. Assim, como apenas estão definidos os estados inicial e final de um processo irreversível, costuma-se representá-lo como uma linha tracejada no espaço termodinâmico, conectando os seus estados inicial e final. É natural que busquemos avaliar a relação (K) ⇒ (AC) também para processos irreversíveis. Assim, sejam os ciclos irreversíveis 𝒫1 e 𝒫2 no mesmo espaço termodinâmico anterior da Fig. 1, representados, respectivamente, na Fig. 3 e na Fig. 4. Figura 3 Ciclo irreversível 𝒫1 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B é irreversível. Logo, 𝒫1 só pode ser realizado no sentido A→B→B′→A. Figura 4 Ciclo irreversível 𝒫2 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B′ é irreversível. Logo, 𝒫2 só pode ser realizado no sentido A→B′→B→A. Os ciclos 𝒫1 e 𝒫2 são construídos de forma análoga aquela posta para o ciclo 𝒫 no caso reversível. No ciclo 𝒫1: o processo irreversível A→B é supostamente adiabático, então 𝒬A→B = 0; o processo reversível B→B′ se mantém na linha em que x1=x1* e x2=x2*, então WB→B′ = 0, porém 𝒬B→B′ > 0 graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo reversível B′→A é também supostamente adiabático, então 𝒬B′→A = 0. Isso fecha o ciclo 𝒫1. Deve-se destacar que graças à irreversibilidade de 𝒫1 o mesmo somente pode ser percorrido no sentido A→B→B′→A. Similarmente, no ciclo 𝒫2: o processo irreversível A→B′ é supostamente adiabático, então 𝒬A→B′ = 0; o processo reversível B′→B se mantém na linha em que x1=x1* e x2=x2*, então WB′→B = 0, porém 𝒬B′→B < 0 graças a diferença de temperatura entre B′ e B, θ∗−θ∗∗ < 0; por último, o processo reversível B→A é também supostamente adiabático, então 𝒬B→A = 0. Isso fecha o ciclo 𝒫2. Da mesma forma que para o ciclo 𝒫1, graças à irreversibilidade de 𝒫2 o mesmo somente pode ser percorrido no sentido A→B′→B→A. Agora, suponha que ambos os ciclos irreversíveis 𝒫1 e 𝒫2 sejam simultaneamente possíveis, ou seja, ambos os ciclos possam ser realizados. Ocorre que, se esse for o caso, então (AC) é falso. Com efeito, novamente, aproximamos B′ de B de forma arbitrária. Ademais, se supormos serem 𝒫1 e 𝒫2 simultaneamente possíveis, então como consequência ambos os processos irreversíveis A→B e A→B′ são também possíveis. Então, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′ por processos adiabáticos irreversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos irreversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, (AC) para processos irreversíveis. Nesse ponto, em comparação com o argumento do caso reversível, o leitor atento já deve ter percebido qual será o próximo passo que deve ser dado. Novamente, a princípio não temos nenhum argumento físico que impeça (AC) de ser falso no caso irreversível. Logo, suponha que (AC) é mesmo falso e então 𝒫1 e 𝒫2 são simultaneamente possíveis. Em seguida, repetindo o argumento do caso reversível e aplicando a primeira lei da termodinâmica tanto em 𝒫1 quanto em 𝒫2, temos que, ao final de cada um desses ciclos (5) 𝒬 ⁢ = ⁢ 𝒲. Na expressão (5) 𝒬 é o calor absorvido, ou cedido, pelo sistema em interação com um reservatório térmico apropriado para cada um dos ciclos, e W é o trabalho efetivo relacionado à s interações do sistema com a sua vizinhança também para cada um dos ciclos. Assumindo que 𝒫1 e 𝒫2 são simultaneamente possíveis, fica claro que uma igualdade análoga à expressão (5) poderia ser escrita para cada um desses ciclos irreversíveis: uma em que W = 𝒬⊤′ ao final do ciclo, relacionada com o ciclo 𝒫1, e uma em que W = 𝒬ℜ′ ao final do ciclo, relacionada com o ciclo 𝒫2. A primeira igualdade falseia (K), uma vez que ela exprimi exatamente o mesmo conteúdo da expressão (1), que é proibida por (K). Logo, para processos irreversíveis (K) ⇒ (AC). Uma argumentação direta para essa conclusão pode ser encontrada no capítulo 5 do livro do Landsberg [15]. Algumas considerações devem ser feitas sobre esse resultado. Observe que a verdadeira fenomenologia por trás de (K) em conexão com (AC) apenas é revelada a partir do estudo dos processos irreversíveis. Já que, se (K) tratasse da impossibilidade de ao final de um ciclo termos W = 𝒬ℜ′, ao invés de W = 𝒬⊤′, nada seria alterado na nossa análise do caso reversível para mostrarmos que (K) ⇒ (AC). A retirada dessa aparente ambiguidade matemática do estudo reversível de (K) apenas ocorre com a análise dos processos irreversíveis, revelando o verdadeiro caráter físico de (K). Para evitar nos estendermos em demasia nessa discussão, a argumentação quanto a recíproca dessa relação entre (AC) e (K) não será apresentada aqui; porém, ela é curta, e pode ser consultada no artigo de Dunning-Davies [23]. trata da dedução do axioma de Carathéodory a partir do princípio de Kelvin, conforme Titulaer e Van Kampen [2222. U.M. Titulaer e N.G. Van Kampen, Physica 31, 1029 (1965).]. Já a seção 4 4. Axioma de Carathéodory a Partir do Princípio de Clausius Apresentamos agora nossa prova da dedução do axioma de Carathéodory a partir do princípio de Clausius. Igualmente como foi feito na seção anterior, estabelecemos o princípio de Clausius, conforme Chandrasekhar [13]: It is impossible that, at the end of a cycle of changes, heat has been transferred from a colder to a hotter body without at the same time converting a certain amount of work into heat. (É impossível que, ao final de um ciclo de mudanças, calor tenha sido transferido de um corpo mais frio para um corpo mais quente sem que ao mesmo tempo se converta uma certa quantidade de trabalho em calor.) ([13] – p. 24) Busquemos realizar uma análise semelhante para o princípio de Clausius – que se mencionará daqui em diante, de forma abreviada, por (C) – daquela que fizemos para (K) na seção anterior. O que (C) diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema absorva uma certa quantidade de calor 𝒬 de um corpo a uma temperatura mais baixa que a do sistema e, em seguida, transfira integralmente essa mesma quantidade de calor 𝒬 para um corpo a uma temperatura mais alta que a do sistema, sem que, durante esse ciclo, haja a conversão de alguma quantidade de trabalho W em calor adicional. Aqui, os corpos mencionados, cujo sistema entra em contato no ciclo descrito, são corpos que preservam as suas respectivas temperaturas quando interagem com o sistema. Isso torna implícito que esses corpos em contato com o sistema que realiza o ciclo são reservatórios térmicos. Então, no esquema do princípio de Clausius, temos um reservatório térmico com uma temperatura mais baixa que a temperatura do sistema, e um reservatório térmico com uma temperatura mais alta que a temperatura do sistema. Esses reservatórios térmicos estudados costumeiramente recebem o sugestivo nome de fontes térmicas; fonte fria para o reservatório térmico sob temperatura mais baixa que a do sistema, e fonte quente para o reservatório térmico sob temperatura mais alta que a do sistema. Ou seja, suponha que um sistema descreve um ciclo termodinâmico que absorve uma certa quantidade de calor 𝒬f de uma fonte fria, e então rejeita uma outra certa quantidade de calor 𝒬q para uma fonte quente, sem que haja nesse ciclo qualquer realização de trabalho efetivo para que seja convertido em calor adicional. Por (C), a seguinte igualdade ao final do ciclo é impossível (6) | 𝒬 f | = | 𝒬 q | . Isto é, ao final do ciclo não podemos ter a igualdade entre as magnitudes das quantidades de calor que foram absorvidas e rejeitadas, respectivamente, da fonte fria, e para a fonte quente. Em (6) devemos escrever o módulo das quantidades de calor no ciclo, pois, em função da interação com o sistema, calor rejeitado para uma fonte é, naturalmente, algebricamente negativo. Assim, já familiarizados com o conteúdo de (AC), desejamos mostrar que (C) ⇒ (AC). Como antes, para isso é suficiente mostrarmos que se (AC) é falso, (C) também é. Vamos mostrar uma prova para essa relação primeiramente para processos reversíveis. Então, seja primeiro 𝒫′ o ciclo reversível representado na Fig. 5 e dado no mesmo espaço termodinâmico que já estamos habituados a trabalhar, para o mesmo sistema termodinâmico modelo anteriormente utilizado. Observe que 𝒫′ percorre o ciclo de pontos B→C→D→A→B no espaço termodinâmico. O trecho A→B′→B e o ciclo 𝒫″ que percorre os pontos B′→B→C→D→A→B′, a princípio não fazem parte do que estamos considerando na Fig. 5. Figura 5 Ciclo reversível 𝒫′ construído através de processos intermediários entre os pontos A, B, C e D no espaço termodinâmico. Uma vez que 𝒫′ é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido B→C→D→A→B. O trecho A→B′→B será discutido posteriormente. Construímos o ciclo reversível 𝒫′ da Fig. 5, percorrendo o ciclo de pontos B→C→D→A→B, de modo que o sistema descreve, durante 𝒫′: o processo B→C, cuja temperatura θ∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a absorção de uma certa quantidade de calor 𝒬B→C > 0 do sistema a partir da vizinhança; o processo C→D, que é supostamente adiabático, logo 𝒬C→D = 0; o processo D→A, cuja temperatura θ∗∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a rejeição de uma certa quantidade de calor 𝒬B→C < 0 do sistema para a vizinhança; por fim, o processo A→B, que é também supostamente adiabático, logo 𝒬A→B = 0. Isso fecha o ciclo 𝒫′. Aqui, algumas considerações importantes devem ser notadas: i) a princípio nada impede que um ciclo como 𝒫′ seja construído, ii) em geral durante 𝒫′ temos |𝒬B→C|≠|𝒬D→A|, com trabalho efetivo sendo convertido em calor adicional, iii) os processos intermediários B→C e D→A de 𝒫′, ao preservarem a temperatura do sistema em contato com a sua vizinhança, indicam que durante esses processos o sistema está em contato com fontes térmicas, sendo que naturalmente a fonte fria é aquela à temperatura θ∗ e a fonte quente é aquela à temperatura θ∗∗, e iv) como 𝒫′ é reversível, toda essa construção idealizada para 𝒫′ poderia ser invertida, invertendo o ciclo e tomando ao contrário uma absorção de calor da fonte quente, e uma rejeição de calor para a fonte fria. Em seguida, notamos o ciclo 𝒫″, que pode também ser visto na Fig. 5 e percorre o ciclo de pontos B′→B→C→D→A→B′ no espaço termodinâmico. Em 𝒫″ o ponto B′ foi escolhido de tal modo que tenhamos |𝒬B′→C| = |𝒬D→A| durante a realização de 𝒫″, com o processo intermediário A→B′ também supostamente adiabático. Dada a possibilidade irrestrita da ocorrência de 𝒫′, se for também verdade que 𝒫″ é possível nos moldes do que foi construído, então significa que os processos adiabáticos A→B′ e A→B são simultaneamente possíveis. Entretanto, se A→B′ e A→B forem simultaneamente possíveis, então (AC) é falso. De fato, podemos aproximar B′ de B de forma arbitrária. E, se supormos 𝒫″ possível, os processos adiabáticos reversíveis A→B′ e A→B se tornam simultaneamente possíveis. Se também aproximarmos arbitrariamente a linha de pontos no espaço termodinâmico cuja temperatura é θ∗, da linha de pontos cuja temperatura é θ∗∗, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Contudo, podemos ver que se assumirmos a falsidade de (AC), a execução de 𝒫″ nos dá de imediato a falsidade de (C). Com efeito, se (AC) é falso então A→B′ e A→B são simultaneamente possíveis, em particular 𝒫″ é possível, e como consequência durante 𝒫″ (7) | 𝒬 B ′ → C | = | 𝒬 D → A | . O que fornece, pela expressão (7), o mesmo que a expressão (6), que é proibida por (C). Logo, para processos reversíveis (C) ⇒ (AC). Espera-se naturalmente que (C) ⇒ (AC) também para o caso irreversível. De fato, uma argumentação quanto a validade da relação (C) ⇒ (AC) para processos irreversíveis se dá de forma natural a partir do que já foi mostrado com a análise análoga de que (K) ⇒ (AC) para o caso irreversível. Para essa argumentação seria necessária a construção de dois ciclos irreversíveis semelhantes a 𝒫′ e 𝒫″, tais que naquele análogo a 𝒫′ o processo A→B seria supostamente adiabático e irreversível, e naquele análogo a 𝒫″ o processo A→B′ seria supostamente adiabático e irreversível. Os outros processos desses ciclos seriam reversíveis. Em seguida, tomaríamos a hipótese de serem esses ciclos irreversíveis construídos simultaneamente possíveis. Assim, repetindo a mesma análise e verificando conclusões similares aquelas obtidas no caso irreversível da relação (K) ⇒ (AC), mostraríamos que, para não violar (C), (AC) também é verdadeiro para processos irreversíveis. Para evitar a repetição desses mesmos passos e das mesmas argumentações já feitas anteriormente, o que tornaria desnecessariamente maçante a discussão aqui realizada, essa etapa não será desenvolvida no presente artigo. trata da nossa dedução do axioma de Carathéodory a partir do princípio de Clausius. Consideramos serem essas etapas as mais importantes ao leitor no que se refere à conexão do formalismo de Carathéodory com a segunda lei da termodinâmica.

Em seguida, procurando contribuir em alguma medida para com a popularização do formalismo de Carathéodory em cursos de termodinâmica clássica em nível de graduação, mostramos ao leitor na seção 5 5. Caminho Para a Entropia Agora, munidos da validade do axioma de Carathéodory, deduzido dos princípios de Clausius e Kelvin nas seções anteriores, e do conteúdo do teorema de Carathéodory, que veremos a seguir, mostraremos como obter a entropia e o conteúdo matemático da segunda lei da termodinâmica a partir do formalismo de Carathéodory. Com esse objetivo em mente, precisaremos antes falar um pouco de alguns aspectos formais do formalismo de Carathéodory. Buscando aliar detalhamento, fluidez e caráter didático na presente seção, a dividimos em duas subseções: uma, a 5.1, para tratar da matemática em si e do teorema usado no formalismo de Carathéodory, e outra, a 5.2, para tratar de um caminho6 possível para a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica por esse formalismo. 5.1. Requisitos matemáticos e teorema deCarathéodory O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [14], que caracterizam um sistema mecânico. Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas. E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é (8) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i . A análise cuidadosa da expressão (8) é crucial para o que segue7. O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ∗ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata. Se a quantidade δχ∗ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ∗ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos (9) d ⁢ χ * = ∑ i = 1 n ∂ ⁡ χ * ∂ ⁡ x i ⁢ d ⁢ x i . Isto é, nesse caso as χi são as derivadas parciais de χ∗ em relação as coordenadas termodinâmicas xi e a função de estado χ∗ pode ser obtida via uma integração comum9 desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ∗ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ∗ em (8), se (10) ∂ ⁡ χ k ∂ ⁡ x l = ∂ ⁡ χ l ∂ ⁡ x k com ( k , l = 1 , 2 , … , n ) . O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ∗ será uma diferencial exata. Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando (11) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Para a equação definida em (11) damos aqui o nome10 de equação diferencial associada a δχ∗. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ∗ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ∗ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ∗ = 0 é, a partir da equação (11) (12) χ * = χ * ⁢ ( x 1 , x 2 , … , x n ) = c . Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ∗(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ∗(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ∗(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação. Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ∗ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação (13) d ⁢ σ = μ ⁢ δ ⁢ η . Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata dσ. Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory. Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [14]: If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation ∑i=1nχi⁢(xj)⁢d⁢xi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação ∑i=1nχi⁢(xj)⁢d⁢xi=0, então a equação é integrável.) ([14] – p. 62) Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 e 4. Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos (14) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i . Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por (15) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável. Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12: Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos. E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica. Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo: Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável. O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [17]. Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13, Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter dσ = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e dσ devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que (16) d ⁢ σ = μ ⁢ δ ⁢ 𝒬 . ■ Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais dσ e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre dσ e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e dσ, ao invés da equação (16), a seguinte expressão (17) δ ⁢ 𝒬 = μ ⁢ d ⁢ σ . Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos. 5.2. Entropia e temperatura absoluta Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca. Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos (18) δ ⁢ 𝒬 C = δ ⁢ 𝒬 A + δ ⁢ 𝒬 B . Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato (19) μ C ⁢ d ⁢ σ C = μ A ⁢ d ⁢ σ A + μ B ⁢ d ⁢ σ B . Reorganizando (19) em termos de dσC, obtemos (20) d ⁢ σ C = μ A μ C ⁢ d ⁢ σ A + μ B μ C ⁢ d ⁢ σ B . Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever (21) d ⁢ σ C = ∂ ⁡ σ C ∂ ⁡ σ A ⁢ d ⁢ σ A + ∂ ⁡ σ C ∂ ⁡ σ B ⁢ d ⁢ σ B . Tal que, comparando as expressões (21) e (20), temos (22a) μ A μ C = ∂ ⁡ σ C ∂ ⁡ σ A ; (22b) μ B μ C = ∂ ⁡ σ C ∂ ⁡ σ B . As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que (23a) μ A μ C = μ A μ C ⁢ ( σ A , σ B ) ; (23b) μ B μ C = μ B μ C ⁢ ( σ A , σ B ) . Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB (24a) μ A = μ A ⁢ ( x 1 , x 2 , … , x n - 1 , σ A , θ ) ; (24b) μ B = μ B ⁢ ( y 1 , y 2 , … , y n - 1 , σ B , θ ) ; (24c) μ C = μ C ⁢ ( x 1 , … , x n - 1 , y 1 , … , y n - 1 , σ A , σ B , θ ) . Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 (25a) μ A = μ A ⁢ ( σ A , θ ) = t ⁢ ( θ ) ⁢ f A ⁢ ( σ A ) ; (25b) μ B = μ B ⁢ ( σ B , θ ) = t ⁢ ( θ ) ⁢ f B ⁢ ( σ B ) ; (25c) μ C = μ C ⁢ ( σ A , σ B , θ ) = t ⁢ ( θ ) ⁢ f C ⁢ ( σ A , σ B ) . Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB. O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [28], a menos de uma constante arbitrária k, de modo que (26) T = k ⁢ t ⁢ ( θ ) . O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [14]. Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer (27) δ ⁢ 𝒬 = T k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Isolando os termos de (27) com a dependência em σ (28) δ ⁢ 𝒬 T = 1 k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos (29) d ⁢ 𝒮 ≡ ∞ ∥ ⁢ { ⁢ ⇐ ⁢ σ ⁢ ⇒ ⁢ ⌈ ⁢ σ ⁢ . A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos (30) d ⁢ 𝒮 ⁢ = ⁢ δ ⁢ 𝒬 𝒯 ⁢ . A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis. Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫⇓ e 𝒫↖, partindo ambos do mesmo ponto arbitrário A. Figura 6 Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫⇓ de A→B′, e 𝒫↖ de A→B. Feito isso, suponha ambos esses processos, 𝒫⇓ e 𝒫↖, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫⇓, negativa durante 𝒫↖. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫⇓ e 𝒫↖ simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis. Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [28]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos (31) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ > 0 . A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos (32) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ ⩾ 0 . A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica. Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [14]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [29]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs. um vislumbre de como a entropia e o conteúdo matemático da segunda lei da termodinâmica surgem como consequência direta da aplicação do teorema de Carathéodory. Para isso, o teorema de Carathéodory foi demonstrado na subseção 5.1 5.1. Requisitos matemáticos e teorema deCarathéodory O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [14], que caracterizam um sistema mecânico. Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas. E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é (8) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i . A análise cuidadosa da expressão (8) é crucial para o que segue7. O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ∗ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata. Se a quantidade δχ∗ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ∗ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos (9) d ⁢ χ * = ∑ i = 1 n ∂ ⁡ χ * ∂ ⁡ x i ⁢ d ⁢ x i . Isto é, nesse caso as χi são as derivadas parciais de χ∗ em relação as coordenadas termodinâmicas xi e a função de estado χ∗ pode ser obtida via uma integração comum9 desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ∗ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ∗ em (8), se (10) ∂ ⁡ χ k ∂ ⁡ x l = ∂ ⁡ χ l ∂ ⁡ x k com ( k , l = 1 , 2 , … , n ) . O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ∗ será uma diferencial exata. Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando (11) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Para a equação definida em (11) damos aqui o nome10 de equação diferencial associada a δχ∗. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ∗ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ∗ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ∗ = 0 é, a partir da equação (11) (12) χ * = χ * ⁢ ( x 1 , x 2 , … , x n ) = c . Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ∗(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ∗(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ∗(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação. Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ∗ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação (13) d ⁢ σ = μ ⁢ δ ⁢ η . Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata dσ. Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory. Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [14]: If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation ∑i=1nχi⁢(xj)⁢d⁢xi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação ∑i=1nχi⁢(xj)⁢d⁢xi=0, então a equação é integrável.) ([14] – p. 62) Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 e 4. Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos (14) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i . Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por (15) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável. Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12: Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos. E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica. Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo: Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável. O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [17]. Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13, Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter dσ = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e dσ devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que (16) d ⁢ σ = μ ⁢ δ ⁢ 𝒬 . ■ Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais dσ e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre dσ e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e dσ, ao invés da equação (16), a seguinte expressão (17) δ ⁢ 𝒬 = μ ⁢ d ⁢ σ . Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos. de forma simples, a partir do argumento de Born [1717. M. Born, Physik. Z. 22, 282 (1921).]. Já a entropia em si foi abordada logo após, na subseção 5.2 5.2. Entropia e temperatura absoluta Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca. Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos (18) δ ⁢ 𝒬 C = δ ⁢ 𝒬 A + δ ⁢ 𝒬 B . Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato (19) μ C ⁢ d ⁢ σ C = μ A ⁢ d ⁢ σ A + μ B ⁢ d ⁢ σ B . Reorganizando (19) em termos de dσC, obtemos (20) d ⁢ σ C = μ A μ C ⁢ d ⁢ σ A + μ B μ C ⁢ d ⁢ σ B . Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever (21) d ⁢ σ C = ∂ ⁡ σ C ∂ ⁡ σ A ⁢ d ⁢ σ A + ∂ ⁡ σ C ∂ ⁡ σ B ⁢ d ⁢ σ B . Tal que, comparando as expressões (21) e (20), temos (22a) μ A μ C = ∂ ⁡ σ C ∂ ⁡ σ A ; (22b) μ B μ C = ∂ ⁡ σ C ∂ ⁡ σ B . As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que (23a) μ A μ C = μ A μ C ⁢ ( σ A , σ B ) ; (23b) μ B μ C = μ B μ C ⁢ ( σ A , σ B ) . Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB (24a) μ A = μ A ⁢ ( x 1 , x 2 , … , x n - 1 , σ A , θ ) ; (24b) μ B = μ B ⁢ ( y 1 , y 2 , … , y n - 1 , σ B , θ ) ; (24c) μ C = μ C ⁢ ( x 1 , … , x n - 1 , y 1 , … , y n - 1 , σ A , σ B , θ ) . Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 (25a) μ A = μ A ⁢ ( σ A , θ ) = t ⁢ ( θ ) ⁢ f A ⁢ ( σ A ) ; (25b) μ B = μ B ⁢ ( σ B , θ ) = t ⁢ ( θ ) ⁢ f B ⁢ ( σ B ) ; (25c) μ C = μ C ⁢ ( σ A , σ B , θ ) = t ⁢ ( θ ) ⁢ f C ⁢ ( σ A , σ B ) . Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB. O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [28], a menos de uma constante arbitrária k, de modo que (26) T = k ⁢ t ⁢ ( θ ) . O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [14]. Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer (27) δ ⁢ 𝒬 = T k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Isolando os termos de (27) com a dependência em σ (28) δ ⁢ 𝒬 T = 1 k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos (29) d ⁢ 𝒮 ≡ ∞ ∥ ⁢ { ⁢ ⇐ ⁢ σ ⁢ ⇒ ⁢ ⌈ ⁢ σ ⁢ . A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos (30) d ⁢ 𝒮 ⁢ = ⁢ δ ⁢ 𝒬 𝒯 ⁢ . A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis. Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫⇓ e 𝒫↖, partindo ambos do mesmo ponto arbitrário A. Figura 6 Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫⇓ de A→B′, e 𝒫↖ de A→B. Feito isso, suponha ambos esses processos, 𝒫⇓ e 𝒫↖, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫⇓, negativa durante 𝒫↖. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫⇓ e 𝒫↖ simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis. Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [28]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos (31) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ > 0 . A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos (32) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ ⩾ 0 . A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica. Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [14]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [29]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs. .

Também, para uma boa compreensão do que segue, basta ao leitor o conhecimento básico dos conceitos fundamentais da termodinâmica clássica: sistema e vizinhança; reservatório térmico, equilíbrio e espaço termodinâmico; coordenadas, estado e processos termodinâmicos; primeira e segunda lei da termodinâmica, etc. Porém, sempre que necessário, por uma questão de ênfase, faremos uma breve discussão de alguns desses conceitos.

Por fim, este artigo não possui o intuito de defender a superioridade do formalismo de Carathéodory com relação aos outros formalismos da termodinâmica clássica. Portanto, tentamos aqui apenas indicar a possibilidade do uso do formalismo de Carathéodory no ensino da termodinâmica clássica.

3. Axioma de Carathéodory a Partir do Princípio de Kelvin

Existem algumas diferenças na literatura quanto à redação dos princípios experimentais da segunda lei da termodinâmica. Assim, mesmo que meramente relacionadas a uma escolha de palavras ligeiramente distintas por cada autor, essas diferenças podem causar confusões na interpretação dos enunciados desses princípios [2525. J. Dunning-Davies, arXiv:1103.4360 (2011).]. Buscando evitar essas situações, este artigo enunciará tanto o axioma de Carathéodory, quanto os princípios de Clausius e Kelvin, conforme encontra-se no livro clássico An Introduction to the Study of Stellar Structure, do ganhador do Nobel de Física de 1983, Subrahmanyan Chandrasekhar.

Segue então o princípio de Kelvin, conforme Chandrasekhar [1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).]:

In a cycle of processes it is impossible to transfer heat from a heat reservoir and convert it all into work, without at the same time transferring a certain amount of heat from a hotter to a colder body. (Em um ciclo de processos é impossível transferir calor de um reservatório térmico e convertê-lo totalmente em trabalho, sem ao mesmo tempo transferir uma certa quantidade de calor de um corpo mais quente para um mais frio.)

([1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).] – p. 24)

O que o princípio de Kelvin – que se mencionará daqui em diante, de forma abreviada, por (K) – diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema converta totalmente calor 𝒬 absorvido de um reservatório térmico em trabalho W sem que, durante o mesmo ciclo, haja também calor cedido do sistema para outro sistema à temperatura mais baixa. Em outras palavras, seja 𝒬 o calor absorvido por um sistema a partir de um reservatório térmico durante um ciclo termodinâmico qualquer, e seja W o trabalho relacionado à interação do sistema com a sua vizinhança durante esse ciclo. Então, por (K), a seguinte igualdade ao final do ciclo é impossível, com 𝒬⊤′

(1) 𝒬 = 𝒲 ⁢.

Observe que (K) destacadamente trabalha com os conceitos de calor, trabalho, e temperatura, de forma a priori. Ou seja, nesse enunciado da segunda lei da termodinâmica, calor, trabalho, e temperatura, são conceitos termodinâmicas elementares.

Entendido (K), segue o axioma de Carathéodory, também conforme Chandrasekhar [1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).]:

Arbitrarily near to any given state there exist states which cannot be reached from an initial state by means of adiabatic processes.

(Arbitrariamente próximo a qualquer estado existem estados que não podem ser alcançados a partir de um estado inicial por meio de processos adiabáticos.)

([1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).] – p. 24)

Há muito para se comentar sobre o axioma de Carathéodory – que se mencionará daqui em diante, de forma abreviada, por (AC) – contudo, inicialmente, faz-se necessário o entendimento da palavra estado nesse contexto. A termodinâmica clássica lida com sistemas macroscópicos em situações de equilíbrio, ou seja, em situações em que as coordenadas, ou variáveis, termodinâmicas do sistema estão bem definidas. Com efeito, quando estabelecido o equilíbrio, analogamente ao caso da mecânica clássica, temos a caracterização completa do sistema termodinâmico pelo valor das suas coordenadas termodinâmicas independentes. E, quando isso é feito, o estado do sistema está definido e é expresso pelo conjunto dessas coordenadas termodinâmicas independentes que caracterizam o equilíbrio. Logo, para a termodinâmica clássica, situações de equilíbrio equivalem a definição do estado do sistema termodinâmico.

Dito isso, vamos ao conteúdo de (AC). O que (AC) estabelece é que, dado um estado qualquer de um sistema termodinâmico, existirão outros estados que o sistema não pode alcançar por meio de processos adiabáticos. Processos adiabáticos são processos que ocorrem sem trocas de energia na forma de calor entre o sistema e a sua vizinhança. Observe que (AC) não faz distinção entre processos reversíveis ou irreversíveis. Perceba aqui que (AC) pressupõe como maior conceito termodinâmico elementar a noção de processo adiabático. Essa construção se faz presente no formalismo de Carathéodory com o objetivo de fugir do conceito direto de fluxo de calor, trocando-o pela ideia de processos não puramente mecânicos.4 4 Para um amplo tratamento dessa questão, sugerimos ao leitor a consulta da seção 8 do livro do Buchdahl [14].

Mas, para de fato entendermos o enunciado de (AC) precisamos analisar o significado do termo “alcançar” que nele consta. Para sair de um estado para outro, o sistema termodinâmico precisa realizar um processo e então chegar a uma nova situação de equilíbrio, configurando assim um novo estado termodinâmico. Dizer que existem estados que não podem ser “alcançados” por processos adiabáticos significa dizer que existem situações de equilíbrio que não podem ser obtidas se usarmos como caminho para isso um processo adiabático. Dito de outra forma, dado um estado qualquer de um sistema termodinâmico, não podemos submeter o sistema a processos adiabáticos arbitrários.

Buscamos agora mostrar que (K) ⇒ (AC). Para isso é suficiente mostrarmos que se (AC) é falso, (K) também é.5 5 Em outras palavras, se for verdade que a negação de (AC) fornece a negação de (K), então, uma vez que (K) é verdadeiro, (AC) também o será. Então, conforme Titulaer e Van Kampen [2222. U.M. Titulaer e N.G. Van Kampen, Physica 31, 1029 (1965).], provamos primeiro que (K) ⇒ (AC) para processos reversíveis. Processos reversíveis são, como o próprio nome sugere, processos passíveis de serem executados em ambas as “direções temporais”, uma vez que todas as situações do sistema durante esses processos são situações de equilíbrio. Por exemplo, se pudermos conceber um sistema constituído de um gás confinado em um recipiente limitado por um êmbolo móvel sem atrito, poderemos abaixar o êmbolo depositando grãos de areia um por um sobre ele, comprimindo assim o gás no recipiente de forma reversível, de modo que o gás sempre se manterá em equilíbrio nesse processo. Por outro lado, se retirarmos os grãos de areia de cima do êmbolo um a um, poderemos, em algum momento, retornar a exata mesma situação de equilíbrio que iniciamos esse raciocínio, retornando o gás ao seu estado termodinâmico original. Esse comportamento temporal reversível define os processos reversíveis. Por isso, processos reversíveis são representados por curvas contínuas no espaço termodinâmico.

Assim, seja um espaço termodinâmico que define os estados termodinâmicos para um sistema termodinâmico modelo com um conjunto usual de três coordenadas termodinâmicas independentes: θ, a temperatura empírica do sistema, mensurada por algum instrumento de medida, em alguma escala de temperatura; x1 e x2, duas coordenadas relacionadas ao comportamento mecânico do sistema termodinâmico. Por exemplo, sendo x1 = V e x2 = M, respectivamente o volume e a magnitude da magnetização do sistema. A escolha por três coordenadas independentes para a caracterização do sistema termodinâmico modelo em discussão se faz, simplesmente, pela facilidade inicial de se trabalhar em três dimensões. No entanto, naturalmente, o que será argumentado a seguir vale também para um número maior de coordenadas termodinâmicas.

Esse espaço termodinâmico, representado na Fig. 1, caracteriza um estado termodinâmico qualquer pelos valores mensurados das coordenadas (θ,x1,x2), por exemplo: (θ0,x10,x20). Por consequência, tal estado é univocamente identificado como um ponto A no referido espaço tal que, A=(θ0,x10,x20).

Figura 1
Espaço termodinâmico das coordenadas θ, x1 e x2.

Além disso, por estarmos tratando de sistemas termodinâmicos, sempre se faz possível a escolha da temperatura empírica como uma das coordenadas termodinâmicas independentes. Em seguida, seja 𝒫 o seguinte ciclo reversível dado no espaço termodinâmico da Fig. 1 e representado na Fig. 2.

Figura 2
Ciclo reversível 𝒫 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. Uma vez que 𝒫 é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido ABB′→A.

O ciclo reversível 𝒫 da Fig. 2 é montado de tal forma que: o processo AB é supostamente adiabático, logo 𝒬AB = 0; o processo BB′ não foge da linha que preserva os valores de x1=x1* e x2=x2*, logo não há trabalho envolvido de B para B′, porém há calor absorvido 𝒬BB > 0 de B para B′ graças a diferença de temperatura entre B e B′, θ∗∗θ > 0; por último, o processo B′→A é também supostamente adiabático, logo 𝒬B′→A = 0. Isso fecha o ciclo 𝒫. Para esse ciclo que construímos é importante percebermos que, como 𝒫 é reversível, toda essa construção idealizada para 𝒫 poderia ser invertida, invertendo o ciclo e tomando ao contrário B′→B tal que, nesse sentido, haveria calor cedido 𝒬B′→B < 0 de B′ para B.

Porém, um olhar mais cuidadoso sobre o ciclo 𝒫 que construímos revela que se ele for possível, então (AC) é falso. Com efeito, pode-se aproximar B′ de B de forma abitrária. Ademais, como 𝒫 é reversível, tanto o processo adiabático AB quanto o processo adiabático AB′ podem ser realizados. Mas, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′por processos adiabáticos reversíveis, então a partir de A todos os estados na mesma linha x1*x2* de B e B′ podem ser alcançados por processos adiabáticos reversíveis. Logo, aproximando também a linha x1*x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis.

Mas como não temos até agora justificativas reais – físicas – para a validade de (AC), suponhamos que 𝒫 é de fato possível e então (AC) é mesmo falso. Vamos agora aplicar a primeira lei da termodinâmica em 𝒫. Isso nos fornece, graças à aditividade da energia

(2) Δ E 𝒫 = Δ E A B + Δ E B B + Δ E B A .

Uma vez que 𝒫 é um ciclo termodinâmico, ΔE𝒫 = 0. Aplicando as características de 𝒫 em (2), temos

(3) - W A B + 𝒬 B B - W B A = 0 .

Observe que as contribuições algébricas efetivas das quantidades de trabalho que aparecem em 𝒫 estão relacionadas à realização de trabalho do sistema na vizinhança, ou da vizinhança no sistema. Então, a expressão (3) pode ser reorganizada. Nomeando de W o trabalho efetivo envolvido no percurso de 𝒫, temos

(4) 𝒬 = 𝒲 ⁢.

Mas isso é análogo ao que diz a equação (1) e assim a equação (4), que vem da hipótese de (AC) ser falso, falseia (K). Logo, para processos reversíveis (K) ⇒ (AC). Porém, sabemos que também lidamos com processos irreversíveis na termodinâmica clássica. Esses processos são, como o próprio nome sugere, processos que apenas podem ser realizados em uma única “direção temporal”, uma vez que as situações intermediárias do sistema em um processo irreversível não são situações de equilíbrio. Mesmo sendo a termodinâmica clássica uma teoria que estuda apenas as situações de equilíbrio, nela uma análise qualitativa dos processos irreversíveis é também possível. Isso se deve ao fato de que, na termodinâmica clássica, as situações iniciais e finais dos processos irreversíveis são sempre situações de equilíbrio. Além do mais, é dos processos irreversíveis que emerge o verdadeiro significado da entropia e da segunda lei da termodinâmica.

Em termos do espaço termodinâmico, processos irreversíveis não podem ser representados como curvas contínuas usuais nesse espaço, ao contrário de como são os processos reversíveis. Assim, como apenas estão definidos os estados inicial e final de um processo irreversível, costuma-se representá-lo como uma linha tracejada no espaço termodinâmico, conectando os seus estados inicial e final. É natural que busquemos avaliar a relação (K) ⇒ (AC) também para processos irreversíveis. Assim, sejam os ciclos irreversíveis 𝒫1 e 𝒫2 no mesmo espaço termodinâmico anterior da Fig. 1, representados, respectivamente, na Fig. 3 e na Fig. 4.

Figura 3
Ciclo irreversível 𝒫1 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário AB é irreversível. Logo, 𝒫1 só pode ser realizado no sentido ABB′→A.
Figura 4
Ciclo irreversível 𝒫2 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário AB′ é irreversível. Logo, 𝒫2 só pode ser realizado no sentido AB′→BA.

Os ciclos 𝒫1 e 𝒫2 são construídos de forma análoga aquela posta para o ciclo 𝒫 no caso reversível. No ciclo 𝒫1: o processo irreversível AB é supostamente adiabático, então 𝒬AB = 0; o processo reversível BB′ se mantém na linha em que x1=x1* e x2=x2*, então WBB = 0, porém 𝒬BB > 0 graças a diferença de temperatura entre B e B′, θ∗∗θ > 0; por último, o processo reversível B′→A é também supostamente adiabático, então 𝒬B′→A = 0. Isso fecha o ciclo 𝒫1. Deve-se destacar que graças à irreversibilidade de 𝒫1 o mesmo somente pode ser percorrido no sentido ABB′→A.

Similarmente, no ciclo 𝒫2: o processo irreversível AB′ é supostamente adiabático, então 𝒬AB = 0; o processo reversível B′→B se mantém na linha em que x1=x1* e x2=x2*, então WB′→B = 0, porém 𝒬B′→B < 0 graças a diferença de temperatura entre B′ e B, θθ∗∗ < 0; por último, o processo reversível BA é também supostamente adiabático, então 𝒬BA = 0. Isso fecha o ciclo 𝒫2. Da mesma forma que para o ciclo 𝒫1, graças à irreversibilidade de 𝒫2 o mesmo somente pode ser percorrido no sentido AB′→BA.

Agora, suponha que ambos os ciclos irreversíveis 𝒫1 e 𝒫2 sejam simultaneamente possíveis, ou seja, ambos os ciclos possam ser realizados. Ocorre que, se esse for o caso, então (AC) é falso. Com efeito, novamente, aproximamos B′ de B de forma arbitrária. Ademais, se supormos serem 𝒫1 e 𝒫2 simultaneamente possíveis, então como consequência ambos os processos irreversíveis AB e AB′ são também possíveis. Então, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′ por processos adiabáticos irreversíveis, então a partir de A todos os estados na mesma linha x1*x2* de B e B′ podem ser alcançados por processos adiabáticos irreversíveis. Logo, aproximando também a linha x1*x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, (AC) para processos irreversíveis.

Nesse ponto, em comparação com o argumento do caso reversível, o leitor atento já deve ter percebido qual será o próximo passo que deve ser dado. Novamente, a princípio não temos nenhum argumento físico que impeça (AC) de ser falso no caso irreversível. Logo, suponha que (AC) é mesmo falso e então 𝒫1 e 𝒫2 são simultaneamente possíveis. Em seguida, repetindo o argumento do caso reversível e aplicando a primeira lei da termodinâmica tanto em 𝒫1 quanto em 𝒫2, temos que, ao final de cada um desses ciclos

(5) 𝒬 = 𝒲.

Na expressão (5) 𝒬 é o calor absorvido, ou cedido, pelo sistema em interação com um reservatório térmico apropriado para cada um dos ciclos, e W é o trabalho efetivo relacionado à s interações do sistema com a sua vizinhança também para cada um dos ciclos. Assumindo que 𝒫1 e 𝒫2 são simultaneamente possíveis, fica claro que uma igualdade análoga à expressão (5) poderia ser escrita para cada um desses ciclos irreversíveis: uma em que W = 𝒬⊤′ ao final do ciclo, relacionada com o ciclo 𝒫1, e uma em que W = 𝒬ℜ′ ao final do ciclo, relacionada com o ciclo 𝒫2. A primeira igualdade falseia (K), uma vez que ela exprimi exatamente o mesmo conteúdo da expressão (1), que é proibida por (K).

Logo, para processos irreversíveis (K) ⇒ (AC). Uma argumentação direta para essa conclusão pode ser encontrada no capítulo 5 do livro do Landsberg [1515. P.T. Landsberg, Thermodynamics and Statistical Mechanics (Dover Publications, New York, 2014).]. Algumas considerações devem ser feitas sobre esse resultado. Observe que a verdadeira fenomenologia por trás de (K) em conexão com (AC) apenas é revelada a partir do estudo dos processos irreversíveis. Já que, se (K) tratasse da impossibilidade de ao final de um ciclo termos W = 𝒬ℜ′, ao invés de W = 𝒬⊤′, nada seria alterado na nossa análise do caso reversível para mostrarmos que (K) ⇒ (AC). A retirada dessa aparente ambiguidade matemática do estudo reversível de (K) apenas ocorre com a análise dos processos irreversíveis, revelando o verdadeiro caráter físico de (K). Para evitar nos estendermos em demasia nessa discussão, a argumentação quanto a recíproca dessa relação entre (AC) e (K) não será apresentada aqui; porém, ela é curta, e pode ser consultada no artigo de Dunning-Davies [2323. J. Dunning-Davies, Nature 208, 576 (1965).].

4. Axioma de Carathéodory a Partir do Princípio de Clausius

Apresentamos agora nossa prova da dedução do axioma de Carathéodory a partir do princípio de Clausius. Igualmente como foi feito na seção anterior, estabelecemos o princípio de Clausius, conforme Chandrasekhar [1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).]:

It is impossible that, at the end of a cycle of changes, heat has been transferred from a colder to a hotter body without at the same time converting a certain amount of work into heat.

(É impossível que, ao final de um ciclo de mudanças, calor tenha sido transferido de um corpo mais frio para um corpo mais quente sem que ao mesmo tempo se converta uma certa quantidade de trabalho em calor.)

([1313. S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).] – p. 24)

Busquemos realizar uma análise semelhante para o princípio de Clausius – que se mencionará daqui em diante, de forma abreviada, por (C) – daquela que fizemos para (K) na seção anterior. O que (C) diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema absorva uma certa quantidade de calor 𝒬 de um corpo a uma temperatura mais baixa que a do sistema e, em seguida, transfira integralmente essa mesma quantidade de calor 𝒬 para um corpo a uma temperatura mais alta que a do sistema, sem que, durante esse ciclo, haja a conversão de alguma quantidade de trabalho W em calor adicional. Aqui, os corpos mencionados, cujo sistema entra em contato no ciclo descrito, são corpos que preservam as suas respectivas temperaturas quando interagem com o sistema. Isso torna implícito que esses corpos em contato com o sistema que realiza o ciclo são reservatórios térmicos.

Então, no esquema do princípio de Clausius, temos um reservatório térmico com uma temperatura mais baixa que a temperatura do sistema, e um reservatório térmico com uma temperatura mais alta que a temperatura do sistema. Esses reservatórios térmicos estudados costumeiramente recebem o sugestivo nome de fontes térmicas; fonte fria para o reservatório térmico sob temperatura mais baixa que a do sistema, e fonte quente para o reservatório térmico sob temperatura mais alta que a do sistema. Ou seja, suponha que um sistema descreve um ciclo termodinâmico que absorve uma certa quantidade de calor 𝒬f de uma fonte fria, e então rejeita uma outra certa quantidade de calor 𝒬q para uma fonte quente, sem que haja nesse ciclo qualquer realização de trabalho efetivo para que seja convertido em calor adicional. Por (C), a seguinte igualdade ao final do ciclo é impossível

(6) | 𝒬 f | = | 𝒬 q | .

Isto é, ao final do ciclo não podemos ter a igualdade entre as magnitudes das quantidades de calor que foram absorvidas e rejeitadas, respectivamente, da fonte fria, e para a fonte quente. Em (6) devemos escrever o módulo das quantidades de calor no ciclo, pois, em função da interação com o sistema, calor rejeitado para uma fonte é, naturalmente, algebricamente negativo.

Assim, já familiarizados com o conteúdo de (AC), desejamos mostrar que (C) ⇒ (AC). Como antes, para isso é suficiente mostrarmos que se (AC) é falso, (C) também é. Vamos mostrar uma prova para essa relação primeiramente para processos reversíveis. Então, seja primeiro 𝒫′ o ciclo reversível representado na Fig. 5 e dado no mesmo espaço termodinâmico que já estamos habituados a trabalhar, para o mesmo sistema termodinâmico modelo anteriormente utilizado. Observe que 𝒫′ percorre o ciclo de pontos BCDAB no espaço termodinâmico. O trecho AB′→B e o ciclo 𝒫 que percorre os pontos B′→BCDAB′, a princípio não fazem parte do que estamos considerando na Fig. 5.

Figura 5
Ciclo reversível 𝒫′ construído através de processos intermediários entre os pontos A, B, C e D no espaço termodinâmico. Uma vez que 𝒫′ é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido BCDAB. O trecho AB′→B será discutido posteriormente.

Construímos o ciclo reversível 𝒫′ da Fig. 5, percorrendo o ciclo de pontos BCDAB, de modo que o sistema descreve, durante 𝒫′: o processo BC, cuja temperatura θ se mantém constante durante o contato do sistema com a vizinhança, mas há a absorção de uma certa quantidade de calor 𝒬BC > 0 do sistema a partir da vizinhança; o processo CD, que é supostamente adiabático, logo 𝒬CD = 0; o processo DA, cuja temperatura θ∗∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a rejeição de uma certa quantidade de calor 𝒬BC < 0 do sistema para a vizinhança; por fim, o processo AB, que é também supostamente adiabático, logo 𝒬AB = 0. Isso fecha o ciclo 𝒫′.

Aqui, algumas considerações importantes devem ser notadas: i) a princípio nada impede que um ciclo como 𝒫′ seja construído, ii) em geral durante 𝒫′ temos |𝒬BC|≠|𝒬DA|, com trabalho efetivo sendo convertido em calor adicional, iii) os processos intermediários BC e DA de 𝒫′, ao preservarem a temperatura do sistema em contato com a sua vizinhança, indicam que durante esses processos o sistema está em contato com fontes térmicas, sendo que naturalmente a fonte fria é aquela à temperatura θ e a fonte quente é aquela à temperatura θ∗∗, e iv) como 𝒫′ é reversível, toda essa construção idealizada para 𝒫′ poderia ser invertida, invertendo o ciclo e tomando ao contrário uma absorção de calor da fonte quente, e uma rejeição de calor para a fonte fria.

Em seguida, notamos o ciclo 𝒫, que pode também ser visto na Fig. 5 e percorre o ciclo de pontos B′→BCDAB′ no espaço termodinâmico. Em 𝒫 o ponto B′ foi escolhido de tal modo que tenhamos |𝒬B′→C| = |𝒬DA| durante a realização de 𝒫, com o processo intermediário AB′ também supostamente adiabático.

Dada a possibilidade irrestrita da ocorrência de 𝒫′, se for também verdade que 𝒫 é possível nos moldes do que foi construído, então significa que os processos adiabáticos AB′ e AB são simultaneamente possíveis. Entretanto, se AB′ e AB forem simultaneamente possíveis, então (AC) é falso. De fato, podemos aproximar B′ de B de forma arbitrária. E, se supormos 𝒫 possível, os processos adiabáticos reversíveis AB′ e AB se tornam simultaneamente possíveis. Se também aproximarmos arbitrariamente a linha de pontos no espaço termodinâmico cuja temperatura é θ, da linha de pontos cuja temperatura é θ∗∗, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis.

Contudo, podemos ver que se assumirmos a falsidade de (AC), a execução de 𝒫 nos dá de imediato a falsidade de (C). Com efeito, se (AC) é falso então AB′ e AB são simultaneamente possíveis, em particular 𝒫 é possível, e como consequência durante 𝒫

(7) | 𝒬 B C | = | 𝒬 D A | .

O que fornece, pela expressão (7), o mesmo que a expressão (6), que é proibida por (C). Logo, para processos reversíveis (C) ⇒ (AC). Espera-se naturalmente que (C) ⇒ (AC) também para o caso irreversível. De fato, uma argumentação quanto a validade da relação (C) ⇒ (AC) para processos irreversíveis se dá de forma natural a partir do que já foi mostrado com a análise análoga de que (K) ⇒ (AC) para o caso irreversível. Para essa argumentação seria necessária a construção de dois ciclos irreversíveis semelhantes a 𝒫′ e 𝒫, tais que naquele análogo a 𝒫′ o processo AB seria supostamente adiabático e irreversível, e naquele análogo a 𝒫 o processo AB′ seria supostamente adiabático e irreversível. Os outros processos desses ciclos seriam reversíveis. Em seguida, tomaríamos a hipótese de serem esses ciclos irreversíveis construídos simultaneamente possíveis.

Assim, repetindo a mesma análise e verificando conclusões similares aquelas obtidas no caso irreversível da relação (K) ⇒ (AC), mostraríamos que, para não violar (C), (AC) também é verdadeiro para processos irreversíveis. Para evitar a repetição desses mesmos passos e das mesmas argumentações já feitas anteriormente, o que tornaria desnecessariamente maçante a discussão aqui realizada, essa etapa não será desenvolvida no presente artigo.

5. Caminho Para a Entropia

Agora, munidos da validade do axioma de Carathéodory, deduzido dos princípios de Clausius e Kelvin nas seções anteriores, e do conteúdo do teorema de Carathéodory, que veremos a seguir, mostraremos como obter a entropia e o conteúdo matemático da segunda lei da termodinâmica a partir do formalismo de Carathéodory. Com esse objetivo em mente, precisaremos antes falar um pouco de alguns aspectos formais do formalismo de Carathéodory. Buscando aliar detalhamento, fluidez e caráter didático na presente seção, a dividimos em duas subseções: uma, a 5.1 5.1. Requisitos matemáticos e teorema deCarathéodory O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [14], que caracterizam um sistema mecânico. Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas. E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é (8) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i . A análise cuidadosa da expressão (8) é crucial para o que segue7. O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ∗ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata. Se a quantidade δχ∗ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ∗ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos (9) d ⁢ χ * = ∑ i = 1 n ∂ ⁡ χ * ∂ ⁡ x i ⁢ d ⁢ x i . Isto é, nesse caso as χi são as derivadas parciais de χ∗ em relação as coordenadas termodinâmicas xi e a função de estado χ∗ pode ser obtida via uma integração comum9 desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ∗ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ∗ em (8), se (10) ∂ ⁡ χ k ∂ ⁡ x l = ∂ ⁡ χ l ∂ ⁡ x k com ( k , l = 1 , 2 , … , n ) . O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ∗ será uma diferencial exata. Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando (11) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Para a equação definida em (11) damos aqui o nome10 de equação diferencial associada a δχ∗. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ∗ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ∗ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ∗ = 0 é, a partir da equação (11) (12) χ * = χ * ⁢ ( x 1 , x 2 , … , x n ) = c . Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ∗(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ∗(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ∗(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação. Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ∗ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação (13) d ⁢ σ = μ ⁢ δ ⁢ η . Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata dσ. Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory. Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [14]: If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation ∑i=1nχi⁢(xj)⁢d⁢xi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação ∑i=1nχi⁢(xj)⁢d⁢xi=0, então a equação é integrável.) ([14] – p. 62) Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 e 4. Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos (14) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i . Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por (15) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável. Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12: Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos. E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica. Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo: Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável. O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [17]. Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13, Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter dσ = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e dσ devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que (16) d ⁢ σ = μ ⁢ δ ⁢ 𝒬 . ■ Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais dσ e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre dσ e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e dσ, ao invés da equação (16), a seguinte expressão (17) δ ⁢ 𝒬 = μ ⁢ d ⁢ σ . Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos. , para tratar da matemática em si e do teorema usado no formalismo de Carathéodory, e outra, a 5.2 5.2. Entropia e temperatura absoluta Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca. Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos (18) δ ⁢ 𝒬 C = δ ⁢ 𝒬 A + δ ⁢ 𝒬 B . Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato (19) μ C ⁢ d ⁢ σ C = μ A ⁢ d ⁢ σ A + μ B ⁢ d ⁢ σ B . Reorganizando (19) em termos de dσC, obtemos (20) d ⁢ σ C = μ A μ C ⁢ d ⁢ σ A + μ B μ C ⁢ d ⁢ σ B . Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever (21) d ⁢ σ C = ∂ ⁡ σ C ∂ ⁡ σ A ⁢ d ⁢ σ A + ∂ ⁡ σ C ∂ ⁡ σ B ⁢ d ⁢ σ B . Tal que, comparando as expressões (21) e (20), temos (22a) μ A μ C = ∂ ⁡ σ C ∂ ⁡ σ A ; (22b) μ B μ C = ∂ ⁡ σ C ∂ ⁡ σ B . As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que (23a) μ A μ C = μ A μ C ⁢ ( σ A , σ B ) ; (23b) μ B μ C = μ B μ C ⁢ ( σ A , σ B ) . Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB (24a) μ A = μ A ⁢ ( x 1 , x 2 , … , x n - 1 , σ A , θ ) ; (24b) μ B = μ B ⁢ ( y 1 , y 2 , … , y n - 1 , σ B , θ ) ; (24c) μ C = μ C ⁢ ( x 1 , … , x n - 1 , y 1 , … , y n - 1 , σ A , σ B , θ ) . Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 (25a) μ A = μ A ⁢ ( σ A , θ ) = t ⁢ ( θ ) ⁢ f A ⁢ ( σ A ) ; (25b) μ B = μ B ⁢ ( σ B , θ ) = t ⁢ ( θ ) ⁢ f B ⁢ ( σ B ) ; (25c) μ C = μ C ⁢ ( σ A , σ B , θ ) = t ⁢ ( θ ) ⁢ f C ⁢ ( σ A , σ B ) . Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB. O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [28], a menos de uma constante arbitrária k, de modo que (26) T = k ⁢ t ⁢ ( θ ) . O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [14]. Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer (27) δ ⁢ 𝒬 = T k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Isolando os termos de (27) com a dependência em σ (28) δ ⁢ 𝒬 T = 1 k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos (29) d ⁢ 𝒮 ≡ ∞ ∥ ⁢ { ⁢ ⇐ ⁢ σ ⁢ ⇒ ⁢ ⌈ ⁢ σ ⁢ . A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos (30) d ⁢ 𝒮 ⁢ = ⁢ δ ⁢ 𝒬 𝒯 ⁢ . A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis. Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫⇓ e 𝒫↖, partindo ambos do mesmo ponto arbitrário A. Figura 6 Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫⇓ de A→B′, e 𝒫↖ de A→B. Feito isso, suponha ambos esses processos, 𝒫⇓ e 𝒫↖, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫⇓, negativa durante 𝒫↖. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫⇓ e 𝒫↖ simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis. Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [28]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos (31) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ > 0 . A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos (32) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ ⩾ 0 . A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica. Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [14]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [29]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs. , para tratar de um caminho6 6 Existem outros caminhos possíveis para isso 7, 14, 15, 16. possível para a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica por esse formalismo.

5.1. Requisitos matemáticos e teorema deCarathéodory

O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).], que caracterizam um sistema mecânico.

Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas.

E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema.

Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é

(8) δ χ * = i = 1 n χ i ( x j ) d x i .

A análise cuidadosa da expressão (8) é crucial para o que segue7 7 Um nome elegante para as quantidades expressas por (8) é o de formas diferenciais pfaffianas [26]. Porém, por se tratar apenas de um termo técnico, e que pouco acrescentaria à discussão do material deste artigo, não usamos dessa nomenclatura. Para o leitor que queira se aprofundar na rica teoria matemática das formas diferenciais pfaffianas, sugerimos a consulta do livro do Sneddon [26] . O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 8 Ou seja, uma quantidade infinitesimal cuja variação somente depende dos seus valores inicial e final. reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata.

Se a quantidade δχ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos

(9) d χ * = i = 1 n χ * x i d x i .

Isto é, nesse caso as χi são as derivadas parciais de χ em relação as coordenadas termodinâmicas xi e a função de estado χ pode ser obtida via uma integração comum9 9 Com δχ∗ definindo uma diferencial exata dχ∗, a tomada da sua integral não precisa especificar nenhum conjunto particular de valores das coordenadas termodinâmicas, o que definiria um caminho para que a integração seja feita. Nesse caso, a integração de dχ∗ avalia apenas os valores inicial e final de χ∗. desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ em (8), se

(10) χ k x l = χ l x k com ( k , l = 1 , 2 , , n ) .

O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ será uma diferencial exata.

Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando

(11) δ χ * = i = 1 n χ i ( x j ) d x i = 0 .

Para a equação definida em (11) damos aqui o nome10 10 Essas equações são costumeiramente chamadas de equações diferenciais de Pfaff [26]. de equação diferencial associada a δχ. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ = 0 é, a partir da equação (11)

(12) χ * = χ * ( x 1 , x 2 , , x n ) = c .

Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação.

Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação

(13) d σ = μ δ η .

Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata . Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 11 Sugerimos a leitura do livro do Buchdahl [14] para o leitor que deseje estudar esses casos mais simples de forma aprofundada. o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory.

Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).]:

If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation i=1nχi(xj)dxi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação i=1nχi(xj)dxi=0, então a equação é integrável.)

([1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).] – p. 62)

Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 3. Axioma de Carathéodory a Partir do Princípio de Kelvin Existem algumas diferenças na literatura quanto à redação dos princípios experimentais da segunda lei da termodinâmica. Assim, mesmo que meramente relacionadas a uma escolha de palavras ligeiramente distintas por cada autor, essas diferenças podem causar confusões na interpretação dos enunciados desses princípios [25]. Buscando evitar essas situações, este artigo enunciará tanto o axioma de Carathéodory, quanto os princípios de Clausius e Kelvin, conforme encontra-se no livro clássico An Introduction to the Study of Stellar Structure, do ganhador do Nobel de Física de 1983, Subrahmanyan Chandrasekhar. Segue então o princípio de Kelvin, conforme Chandrasekhar [13]: In a cycle of processes it is impossible to transfer heat from a heat reservoir and convert it all into work, without at the same time transferring a certain amount of heat from a hotter to a colder body. (Em um ciclo de processos é impossível transferir calor de um reservatório térmico e convertê-lo totalmente em trabalho, sem ao mesmo tempo transferir uma certa quantidade de calor de um corpo mais quente para um mais frio.) ([13] – p. 24) O que o princípio de Kelvin – que se mencionará daqui em diante, de forma abreviada, por (K) – diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema converta totalmente calor 𝒬 absorvido de um reservatório térmico em trabalho W sem que, durante o mesmo ciclo, haja também calor cedido do sistema para outro sistema à temperatura mais baixa. Em outras palavras, seja 𝒬 o calor absorvido por um sistema a partir de um reservatório térmico durante um ciclo termodinâmico qualquer, e seja W o trabalho relacionado à interação do sistema com a sua vizinhança durante esse ciclo. Então, por (K), a seguinte igualdade ao final do ciclo é impossível, com 𝒬⊤′ (1) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Observe que (K) destacadamente trabalha com os conceitos de calor, trabalho, e temperatura, de forma a priori. Ou seja, nesse enunciado da segunda lei da termodinâmica, calor, trabalho, e temperatura, são conceitos termodinâmicas elementares. Entendido (K), segue o axioma de Carathéodory, também conforme Chandrasekhar [13]: Arbitrarily near to any given state there exist states which cannot be reached from an initial state by means of adiabatic processes. (Arbitrariamente próximo a qualquer estado existem estados que não podem ser alcançados a partir de um estado inicial por meio de processos adiabáticos.) ([13] – p. 24) Há muito para se comentar sobre o axioma de Carathéodory – que se mencionará daqui em diante, de forma abreviada, por (AC) – contudo, inicialmente, faz-se necessário o entendimento da palavra estado nesse contexto. A termodinâmica clássica lida com sistemas macroscópicos em situações de equilíbrio, ou seja, em situações em que as coordenadas, ou variáveis, termodinâmicas do sistema estão bem definidas. Com efeito, quando estabelecido o equilíbrio, analogamente ao caso da mecânica clássica, temos a caracterização completa do sistema termodinâmico pelo valor das suas coordenadas termodinâmicas independentes. E, quando isso é feito, o estado do sistema está definido e é expresso pelo conjunto dessas coordenadas termodinâmicas independentes que caracterizam o equilíbrio. Logo, para a termodinâmica clássica, situações de equilíbrio equivalem a definição do estado do sistema termodinâmico. Dito isso, vamos ao conteúdo de (AC). O que (AC) estabelece é que, dado um estado qualquer de um sistema termodinâmico, existirão outros estados que o sistema não pode alcançar por meio de processos adiabáticos. Processos adiabáticos são processos que ocorrem sem trocas de energia na forma de calor entre o sistema e a sua vizinhança. Observe que (AC) não faz distinção entre processos reversíveis ou irreversíveis. Perceba aqui que (AC) pressupõe como maior conceito termodinâmico elementar a noção de processo adiabático. Essa construção se faz presente no formalismo de Carathéodory com o objetivo de fugir do conceito direto de fluxo de calor, trocando-o pela ideia de processos não puramente mecânicos.4 Mas, para de fato entendermos o enunciado de (AC) precisamos analisar o significado do termo “alcançar” que nele consta. Para sair de um estado para outro, o sistema termodinâmico precisa realizar um processo e então chegar a uma nova situação de equilíbrio, configurando assim um novo estado termodinâmico. Dizer que existem estados que não podem ser “alcançados” por processos adiabáticos significa dizer que existem situações de equilíbrio que não podem ser obtidas se usarmos como caminho para isso um processo adiabático. Dito de outra forma, dado um estado qualquer de um sistema termodinâmico, não podemos submeter o sistema a processos adiabáticos arbitrários. Buscamos agora mostrar que (K) ⇒ (AC). Para isso é suficiente mostrarmos que se (AC) é falso, (K) também é.5 Então, conforme Titulaer e Van Kampen [22], provamos primeiro que (K) ⇒ (AC) para processos reversíveis. Processos reversíveis são, como o próprio nome sugere, processos passíveis de serem executados em ambas as “direções temporais”, uma vez que todas as situações do sistema durante esses processos são situações de equilíbrio. Por exemplo, se pudermos conceber um sistema constituído de um gás confinado em um recipiente limitado por um êmbolo móvel sem atrito, poderemos abaixar o êmbolo depositando grãos de areia um por um sobre ele, comprimindo assim o gás no recipiente de forma reversível, de modo que o gás sempre se manterá em equilíbrio nesse processo. Por outro lado, se retirarmos os grãos de areia de cima do êmbolo um a um, poderemos, em algum momento, retornar a exata mesma situação de equilíbrio que iniciamos esse raciocínio, retornando o gás ao seu estado termodinâmico original. Esse comportamento temporal reversível define os processos reversíveis. Por isso, processos reversíveis são representados por curvas contínuas no espaço termodinâmico. Assim, seja um espaço termodinâmico que define os estados termodinâmicos para um sistema termodinâmico modelo com um conjunto usual de três coordenadas termodinâmicas independentes: θ, a temperatura empírica do sistema, mensurada por algum instrumento de medida, em alguma escala de temperatura; x1 e x2, duas coordenadas relacionadas ao comportamento mecânico do sistema termodinâmico. Por exemplo, sendo x1 = V e x2 = M, respectivamente o volume e a magnitude da magnetização do sistema. A escolha por três coordenadas independentes para a caracterização do sistema termodinâmico modelo em discussão se faz, simplesmente, pela facilidade inicial de se trabalhar em três dimensões. No entanto, naturalmente, o que será argumentado a seguir vale também para um número maior de coordenadas termodinâmicas. Esse espaço termodinâmico, representado na Fig. 1, caracteriza um estado termodinâmico qualquer pelos valores mensurados das coordenadas (θ,x1,x2), por exemplo: (θ0,x10,x20). Por consequência, tal estado é univocamente identificado como um ponto A no referido espaço tal que, A=(θ0,x10,x20). Figura 1 Espaço termodinâmico das coordenadas θ, x1 e x2. Além disso, por estarmos tratando de sistemas termodinâmicos, sempre se faz possível a escolha da temperatura empírica como uma das coordenadas termodinâmicas independentes. Em seguida, seja 𝒫 o seguinte ciclo reversível dado no espaço termodinâmico da Fig. 1 e representado na Fig. 2. Figura 2 Ciclo reversível 𝒫 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. Uma vez que 𝒫 é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido A→B→B′→A. O ciclo reversível 𝒫 da Fig. 2 é montado de tal forma que: o processo A→B é supostamente adiabático, logo 𝒬A→B = 0; o processo B→B′ não foge da linha que preserva os valores de x1=x1* e x2=x2*, logo não há trabalho envolvido de B para B′, porém há calor absorvido 𝒬B→B′ > 0 de B para B′ graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo B′→A é também supostamente adiabático, logo 𝒬B′→A = 0. Isso fecha o ciclo 𝒫. Para esse ciclo que construímos é importante percebermos que, como 𝒫 é reversível, toda essa construção idealizada para 𝒫 poderia ser invertida, invertendo o ciclo e tomando ao contrário B′→B tal que, nesse sentido, haveria calor cedido 𝒬B′→B < 0 de B′ para B. Porém, um olhar mais cuidadoso sobre o ciclo 𝒫 que construímos revela que se ele for possível, então (AC) é falso. Com efeito, pode-se aproximar B′ de B de forma abitrária. Ademais, como 𝒫 é reversível, tanto o processo adiabático A→B quanto o processo adiabático A→B′ podem ser realizados. Mas, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′por processos adiabáticos reversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos reversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Mas como não temos até agora justificativas reais – físicas – para a validade de (AC), suponhamos que 𝒫 é de fato possível e então (AC) é mesmo falso. Vamos agora aplicar a primeira lei da termodinâmica em 𝒫. Isso nos fornece, graças à aditividade da energia (2) Δ ⁢ E 𝒫 = Δ ⁢ E A → B + Δ ⁢ E B → B ′ + Δ ⁢ E B ′ → A . Uma vez que 𝒫 é um ciclo termodinâmico, ΔE𝒫 = 0. Aplicando as características de 𝒫 em (2), temos (3) - W A → B + 𝒬 B → B ′ - W B ′ → A = 0 . Observe que as contribuições algébricas efetivas das quantidades de trabalho que aparecem em 𝒫 estão relacionadas à realização de trabalho do sistema na vizinhança, ou da vizinhança no sistema. Então, a expressão (3) pode ser reorganizada. Nomeando de W o trabalho efetivo envolvido no percurso de 𝒫, temos (4) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Mas isso é análogo ao que diz a equação (1) e assim a equação (4), que vem da hipótese de (AC) ser falso, falseia (K). Logo, para processos reversíveis (K) ⇒ (AC). Porém, sabemos que também lidamos com processos irreversíveis na termodinâmica clássica. Esses processos são, como o próprio nome sugere, processos que apenas podem ser realizados em uma única “direção temporal”, uma vez que as situações intermediárias do sistema em um processo irreversível não são situações de equilíbrio. Mesmo sendo a termodinâmica clássica uma teoria que estuda apenas as situações de equilíbrio, nela uma análise qualitativa dos processos irreversíveis é também possível. Isso se deve ao fato de que, na termodinâmica clássica, as situações iniciais e finais dos processos irreversíveis são sempre situações de equilíbrio. Além do mais, é dos processos irreversíveis que emerge o verdadeiro significado da entropia e da segunda lei da termodinâmica. Em termos do espaço termodinâmico, processos irreversíveis não podem ser representados como curvas contínuas usuais nesse espaço, ao contrário de como são os processos reversíveis. Assim, como apenas estão definidos os estados inicial e final de um processo irreversível, costuma-se representá-lo como uma linha tracejada no espaço termodinâmico, conectando os seus estados inicial e final. É natural que busquemos avaliar a relação (K) ⇒ (AC) também para processos irreversíveis. Assim, sejam os ciclos irreversíveis 𝒫1 e 𝒫2 no mesmo espaço termodinâmico anterior da Fig. 1, representados, respectivamente, na Fig. 3 e na Fig. 4. Figura 3 Ciclo irreversível 𝒫1 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B é irreversível. Logo, 𝒫1 só pode ser realizado no sentido A→B→B′→A. Figura 4 Ciclo irreversível 𝒫2 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B′ é irreversível. Logo, 𝒫2 só pode ser realizado no sentido A→B′→B→A. Os ciclos 𝒫1 e 𝒫2 são construídos de forma análoga aquela posta para o ciclo 𝒫 no caso reversível. No ciclo 𝒫1: o processo irreversível A→B é supostamente adiabático, então 𝒬A→B = 0; o processo reversível B→B′ se mantém na linha em que x1=x1* e x2=x2*, então WB→B′ = 0, porém 𝒬B→B′ > 0 graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo reversível B′→A é também supostamente adiabático, então 𝒬B′→A = 0. Isso fecha o ciclo 𝒫1. Deve-se destacar que graças à irreversibilidade de 𝒫1 o mesmo somente pode ser percorrido no sentido A→B→B′→A. Similarmente, no ciclo 𝒫2: o processo irreversível A→B′ é supostamente adiabático, então 𝒬A→B′ = 0; o processo reversível B′→B se mantém na linha em que x1=x1* e x2=x2*, então WB′→B = 0, porém 𝒬B′→B < 0 graças a diferença de temperatura entre B′ e B, θ∗−θ∗∗ < 0; por último, o processo reversível B→A é também supostamente adiabático, então 𝒬B→A = 0. Isso fecha o ciclo 𝒫2. Da mesma forma que para o ciclo 𝒫1, graças à irreversibilidade de 𝒫2 o mesmo somente pode ser percorrido no sentido A→B′→B→A. Agora, suponha que ambos os ciclos irreversíveis 𝒫1 e 𝒫2 sejam simultaneamente possíveis, ou seja, ambos os ciclos possam ser realizados. Ocorre que, se esse for o caso, então (AC) é falso. Com efeito, novamente, aproximamos B′ de B de forma arbitrária. Ademais, se supormos serem 𝒫1 e 𝒫2 simultaneamente possíveis, então como consequência ambos os processos irreversíveis A→B e A→B′ são também possíveis. Então, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′ por processos adiabáticos irreversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos irreversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, (AC) para processos irreversíveis. Nesse ponto, em comparação com o argumento do caso reversível, o leitor atento já deve ter percebido qual será o próximo passo que deve ser dado. Novamente, a princípio não temos nenhum argumento físico que impeça (AC) de ser falso no caso irreversível. Logo, suponha que (AC) é mesmo falso e então 𝒫1 e 𝒫2 são simultaneamente possíveis. Em seguida, repetindo o argumento do caso reversível e aplicando a primeira lei da termodinâmica tanto em 𝒫1 quanto em 𝒫2, temos que, ao final de cada um desses ciclos (5) 𝒬 ⁢ = ⁢ 𝒲. Na expressão (5) 𝒬 é o calor absorvido, ou cedido, pelo sistema em interação com um reservatório térmico apropriado para cada um dos ciclos, e W é o trabalho efetivo relacionado à s interações do sistema com a sua vizinhança também para cada um dos ciclos. Assumindo que 𝒫1 e 𝒫2 são simultaneamente possíveis, fica claro que uma igualdade análoga à expressão (5) poderia ser escrita para cada um desses ciclos irreversíveis: uma em que W = 𝒬⊤′ ao final do ciclo, relacionada com o ciclo 𝒫1, e uma em que W = 𝒬ℜ′ ao final do ciclo, relacionada com o ciclo 𝒫2. A primeira igualdade falseia (K), uma vez que ela exprimi exatamente o mesmo conteúdo da expressão (1), que é proibida por (K). Logo, para processos irreversíveis (K) ⇒ (AC). Uma argumentação direta para essa conclusão pode ser encontrada no capítulo 5 do livro do Landsberg [15]. Algumas considerações devem ser feitas sobre esse resultado. Observe que a verdadeira fenomenologia por trás de (K) em conexão com (AC) apenas é revelada a partir do estudo dos processos irreversíveis. Já que, se (K) tratasse da impossibilidade de ao final de um ciclo termos W = 𝒬ℜ′, ao invés de W = 𝒬⊤′, nada seria alterado na nossa análise do caso reversível para mostrarmos que (K) ⇒ (AC). A retirada dessa aparente ambiguidade matemática do estudo reversível de (K) apenas ocorre com a análise dos processos irreversíveis, revelando o verdadeiro caráter físico de (K). Para evitar nos estendermos em demasia nessa discussão, a argumentação quanto a recíproca dessa relação entre (AC) e (K) não será apresentada aqui; porém, ela é curta, e pode ser consultada no artigo de Dunning-Davies [23]. e 4 4. Axioma de Carathéodory a Partir do Princípio de Clausius Apresentamos agora nossa prova da dedução do axioma de Carathéodory a partir do princípio de Clausius. Igualmente como foi feito na seção anterior, estabelecemos o princípio de Clausius, conforme Chandrasekhar [13]: It is impossible that, at the end of a cycle of changes, heat has been transferred from a colder to a hotter body without at the same time converting a certain amount of work into heat. (É impossível que, ao final de um ciclo de mudanças, calor tenha sido transferido de um corpo mais frio para um corpo mais quente sem que ao mesmo tempo se converta uma certa quantidade de trabalho em calor.) ([13] – p. 24) Busquemos realizar uma análise semelhante para o princípio de Clausius – que se mencionará daqui em diante, de forma abreviada, por (C) – daquela que fizemos para (K) na seção anterior. O que (C) diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema absorva uma certa quantidade de calor 𝒬 de um corpo a uma temperatura mais baixa que a do sistema e, em seguida, transfira integralmente essa mesma quantidade de calor 𝒬 para um corpo a uma temperatura mais alta que a do sistema, sem que, durante esse ciclo, haja a conversão de alguma quantidade de trabalho W em calor adicional. Aqui, os corpos mencionados, cujo sistema entra em contato no ciclo descrito, são corpos que preservam as suas respectivas temperaturas quando interagem com o sistema. Isso torna implícito que esses corpos em contato com o sistema que realiza o ciclo são reservatórios térmicos. Então, no esquema do princípio de Clausius, temos um reservatório térmico com uma temperatura mais baixa que a temperatura do sistema, e um reservatório térmico com uma temperatura mais alta que a temperatura do sistema. Esses reservatórios térmicos estudados costumeiramente recebem o sugestivo nome de fontes térmicas; fonte fria para o reservatório térmico sob temperatura mais baixa que a do sistema, e fonte quente para o reservatório térmico sob temperatura mais alta que a do sistema. Ou seja, suponha que um sistema descreve um ciclo termodinâmico que absorve uma certa quantidade de calor 𝒬f de uma fonte fria, e então rejeita uma outra certa quantidade de calor 𝒬q para uma fonte quente, sem que haja nesse ciclo qualquer realização de trabalho efetivo para que seja convertido em calor adicional. Por (C), a seguinte igualdade ao final do ciclo é impossível (6) | 𝒬 f | = | 𝒬 q | . Isto é, ao final do ciclo não podemos ter a igualdade entre as magnitudes das quantidades de calor que foram absorvidas e rejeitadas, respectivamente, da fonte fria, e para a fonte quente. Em (6) devemos escrever o módulo das quantidades de calor no ciclo, pois, em função da interação com o sistema, calor rejeitado para uma fonte é, naturalmente, algebricamente negativo. Assim, já familiarizados com o conteúdo de (AC), desejamos mostrar que (C) ⇒ (AC). Como antes, para isso é suficiente mostrarmos que se (AC) é falso, (C) também é. Vamos mostrar uma prova para essa relação primeiramente para processos reversíveis. Então, seja primeiro 𝒫′ o ciclo reversível representado na Fig. 5 e dado no mesmo espaço termodinâmico que já estamos habituados a trabalhar, para o mesmo sistema termodinâmico modelo anteriormente utilizado. Observe que 𝒫′ percorre o ciclo de pontos B→C→D→A→B no espaço termodinâmico. O trecho A→B′→B e o ciclo 𝒫″ que percorre os pontos B′→B→C→D→A→B′, a princípio não fazem parte do que estamos considerando na Fig. 5. Figura 5 Ciclo reversível 𝒫′ construído através de processos intermediários entre os pontos A, B, C e D no espaço termodinâmico. Uma vez que 𝒫′ é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido B→C→D→A→B. O trecho A→B′→B será discutido posteriormente. Construímos o ciclo reversível 𝒫′ da Fig. 5, percorrendo o ciclo de pontos B→C→D→A→B, de modo que o sistema descreve, durante 𝒫′: o processo B→C, cuja temperatura θ∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a absorção de uma certa quantidade de calor 𝒬B→C > 0 do sistema a partir da vizinhança; o processo C→D, que é supostamente adiabático, logo 𝒬C→D = 0; o processo D→A, cuja temperatura θ∗∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a rejeição de uma certa quantidade de calor 𝒬B→C < 0 do sistema para a vizinhança; por fim, o processo A→B, que é também supostamente adiabático, logo 𝒬A→B = 0. Isso fecha o ciclo 𝒫′. Aqui, algumas considerações importantes devem ser notadas: i) a princípio nada impede que um ciclo como 𝒫′ seja construído, ii) em geral durante 𝒫′ temos |𝒬B→C|≠|𝒬D→A|, com trabalho efetivo sendo convertido em calor adicional, iii) os processos intermediários B→C e D→A de 𝒫′, ao preservarem a temperatura do sistema em contato com a sua vizinhança, indicam que durante esses processos o sistema está em contato com fontes térmicas, sendo que naturalmente a fonte fria é aquela à temperatura θ∗ e a fonte quente é aquela à temperatura θ∗∗, e iv) como 𝒫′ é reversível, toda essa construção idealizada para 𝒫′ poderia ser invertida, invertendo o ciclo e tomando ao contrário uma absorção de calor da fonte quente, e uma rejeição de calor para a fonte fria. Em seguida, notamos o ciclo 𝒫″, que pode também ser visto na Fig. 5 e percorre o ciclo de pontos B′→B→C→D→A→B′ no espaço termodinâmico. Em 𝒫″ o ponto B′ foi escolhido de tal modo que tenhamos |𝒬B′→C| = |𝒬D→A| durante a realização de 𝒫″, com o processo intermediário A→B′ também supostamente adiabático. Dada a possibilidade irrestrita da ocorrência de 𝒫′, se for também verdade que 𝒫″ é possível nos moldes do que foi construído, então significa que os processos adiabáticos A→B′ e A→B são simultaneamente possíveis. Entretanto, se A→B′ e A→B forem simultaneamente possíveis, então (AC) é falso. De fato, podemos aproximar B′ de B de forma arbitrária. E, se supormos 𝒫″ possível, os processos adiabáticos reversíveis A→B′ e A→B se tornam simultaneamente possíveis. Se também aproximarmos arbitrariamente a linha de pontos no espaço termodinâmico cuja temperatura é θ∗, da linha de pontos cuja temperatura é θ∗∗, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Contudo, podemos ver que se assumirmos a falsidade de (AC), a execução de 𝒫″ nos dá de imediato a falsidade de (C). Com efeito, se (AC) é falso então A→B′ e A→B são simultaneamente possíveis, em particular 𝒫″ é possível, e como consequência durante 𝒫″ (7) | 𝒬 B ′ → C | = | 𝒬 D → A | . O que fornece, pela expressão (7), o mesmo que a expressão (6), que é proibida por (C). Logo, para processos reversíveis (C) ⇒ (AC). Espera-se naturalmente que (C) ⇒ (AC) também para o caso irreversível. De fato, uma argumentação quanto a validade da relação (C) ⇒ (AC) para processos irreversíveis se dá de forma natural a partir do que já foi mostrado com a análise análoga de que (K) ⇒ (AC) para o caso irreversível. Para essa argumentação seria necessária a construção de dois ciclos irreversíveis semelhantes a 𝒫′ e 𝒫″, tais que naquele análogo a 𝒫′ o processo A→B seria supostamente adiabático e irreversível, e naquele análogo a 𝒫″ o processo A→B′ seria supostamente adiabático e irreversível. Os outros processos desses ciclos seriam reversíveis. Em seguida, tomaríamos a hipótese de serem esses ciclos irreversíveis construídos simultaneamente possíveis. Assim, repetindo a mesma análise e verificando conclusões similares aquelas obtidas no caso irreversível da relação (K) ⇒ (AC), mostraríamos que, para não violar (C), (AC) também é verdadeiro para processos irreversíveis. Para evitar a repetição desses mesmos passos e das mesmas argumentações já feitas anteriormente, o que tornaria desnecessariamente maçante a discussão aqui realizada, essa etapa não será desenvolvida no presente artigo. . Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos

(14) δ 𝒬 = i = 1 n 𝒬 i ( x j ) d x i .

Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por

(15) δ 𝒬 = i = 1 n 𝒬 i ( x j ) d x i = 0 .

Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável.

Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12 12 Lembre-se, já justificamos a relação unívoca entre estados termodinâmicos e pontos no espaço termodinâmico. :

Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos.

E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica.

Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo:

Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável.

O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [1717. M. Born, Physik. Z. 22, 282 (1921).].

Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13 13 Essa verificação é simples, conforme discute Landsberg [15]. , Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que

(16) d σ = μ δ 𝒬 .

Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e , ao invés da equação (16), a seguinte expressão

(17) δ 𝒬 = μ d σ .

Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos.

5.2. Entropia e temperatura absoluta

Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca.

Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos

(18) δ 𝒬 C = δ 𝒬 A + δ 𝒬 B .

Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 14 De forma geral, o tempo para que o equilíbrio termodinâmico ocorra durante uma interação termodinâmica qualquer – mecânica, química, etc. – entre sistemas termodinâmicos é chamado de tempo de relaxação. Uma bela discussão sobre esse conceito em seu aspecto macroscópico pode ser encontrada no livro do Callen [4]. que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato

(19) μ C d σ C = μ A d σ A + μ B d σ B .

Reorganizando (19) em termos de C, obtemos

(20) d σ C = μ A μ C d σ A + μ B μ C d σ B .

Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever

(21) d σ C = σ C σ A d σ A + σ C σ B d σ B .

Tal que, comparando as expressões (21) e (20), temos

(22a) μ A μ C = σ C σ A ;
(22b) μ B μ C = σ C σ B .

As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que

(23a) μ A μ C = μ A μ C ( σ A , σ B ) ;
(23b) μ B μ C = μ B μ C ( σ A , σ B ) .

Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB

(24a) μ A = μ A ( x 1 , x 2 , , x n - 1 , σ A , θ ) ;
(24b) μ B = μ B ( y 1 , y 2 , , y n - 1 , σ B , θ ) ;
(24c) μ C = μ C ( x 1 , , x n - 1 , y 1 , , y n - 1 , σ A , σ B , θ ) .

Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 15 Uma argumentação mais detalhada para esse passo pode ser encontrada no artigo de Zemansky [20].

(25a) μ A = μ A ( σ A , θ ) = t ( θ ) f A ( σ A ) ;
(25b) μ B = μ B ( σ B , θ ) = t ( θ ) f B ( σ B ) ;
(25c) μ C = μ C ( σ A , σ B , θ ) = t ( θ ) f C ( σ A , σ B ) .

Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 16 Devemos destacar que o formalismo de Clausius também indica que a temperatura está relacionada ao fator integrante do calor [27]. No formalismo de Gibbs, apesar de também presente, esse fato não é muito relevante. t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB.

O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [2828. W. Pauli, Thermodynamics and the Kinetic Theory of Gases: Volume 3 of Pauli Lectures on Physics (Dover Publications, New York, 1973).], a menos de uma constante arbitrária k, de modo que

(26) T = k t ( θ ) .

O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 17 Recomendamos fortemente ao leitor a consulta da seção 11 e dos apêndices [A-6] e [A-8] do livro do Pauli [28], para uma esclarecedora discussão sobre esse assunto. e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).].

Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer

(27) δ 𝒬 = T k f ( σ ) d σ .

Isolando os termos de (27) com a dependência em σ

(28) δ 𝒬 T = 1 k f ( σ ) d σ .

Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos

(29) d 𝒮 { σ σ .

A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos

(30) d 𝒮 = δ 𝒬 𝒯 .

A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis.

Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫 e 𝒫, partindo ambos do mesmo ponto arbitrário A.

Figura 6
Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫 de AB′, e 𝒫 de AB.

Feito isso, suponha ambos esses processos, 𝒫 e 𝒫, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫, negativa durante 𝒫. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫 e 𝒫 simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis.

Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [2828. W. Pauli, Thermodynamics and the Kinetic Theory of Gases: Volume 3 of Pauli Lectures on Physics (Dover Publications, New York, 1973).]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos

(31) Δ 𝒮 𝒬 = > 0 .

A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos

(32) Δ 𝒮 𝒬 = 0 .

A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica.

Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [2929. A.B. Pippard, The Elements of Classical Thermodynamics (Cambridge University Press, London, 1957).]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs.

6. Conclusão

Neste artigo, abordamos um pouco da construção do formalismo de Carathéodory para a termodinâmica clássica em relação aos outros formalismos mais conhecidos dessa teoria. Na seção 2 2. Formalismo de Carathéodory Em um artigo de 1909 publicado no Mathematische Annalen, o matemático Constantin Carathéodory [10], propôs um formalismo para a termodinâmica clássica que obtinha os resultados da teoria3 a partir de dois axiomas, um para a primeira lei, e outro para a segunda lei da termodinâmica, de forma que o desenvolvimento dos conceitos termodinâmicos se dava em termos de considerações oriundas de conceitos mecânicos. O axioma usado por Carathéodory para a segunda lei da termodinâmica foi a maior novidade do seu trabalho. Esse axioma não era baseado em experimentos, não obstante, dele emergiam a entropia e o seu conteúdo matemático clássico. Apesar desse axioma ser eventualmente conhecido como o segundo axioma de Carathéodory [12], dada a existência de um axioma de Carathéodory também para a primeira lei da termodinâmica, nosso maior foco aqui é o estudo em particular da segunda lei da termodinâmica. Por esse motivo, doravante iremos nos referir ao axioma de Carathéodory para a segunda lei da termodinâmica apenas como axioma de Carathéodory. Vários autores se dedicaram à missão de disseminar as ideias de Carathéodory ao longo dos anos, a saber: Sears [12], Chandrasekhar [13], Buchdahl [14], Landsberg [15], Dunning-Davies [16], entre outros. Em especial, Max Born, um dos físicos precursores da mecânica quântica, defendeu a visão de Carathéodory durante uma grande parte da sua vida. Com publicações [17, 18] e também com duras críticas ao formalismo de Clausius, Born buscou popularizar o formalismo de Carathéodory ao dizer, por exemplo, em um artigo de 1921: a) Não existe nenhuma outra área da física onde são aplicadas considerações que tenham qualquer semelhança com o ciclo de Carnot e correlatos. b) Tem-se que admitir que a termodinâmica, no seu modelo tradicional, ainda não realizou o ideal lógico da separação entre o conteúdo físico e a descrição matemática. c) É preciso fazer uma remoção de entulhos, que uma tradição cheia de piedade demais até aqui, não ousou remover. [ênfase do autor][17] Em correspondência a Einstein [19], exatamente sobre essa publicação [17] que submetia ao atual Physikalische Zeitschrift, Born escreveu: Frankfurt a.M. 12 February, 1921 Dear Einstein …I have done little theoretical work. I have recently written an account of Carathéodory’s thermodynamics, which will appear shortly in the Physikalische Zeitung. I am very curious to know what you will say about it. Frankfurt a.M. 12 Fevereiro, 1921 (Prezado Einstein …Tenho feito pouco trabalho teórico. Recentemente escrevi uma exposição da termodinâmica de Carathéodory, a qual irá aparecer em breve no Physikalische Zeitung. Estou muito curioso para saber o que você dirá a respeito.) (19 – p. 53) Já havendo publicado os trabalhos que elevariam seu nome ao patamar de um dos maiores da história da ciência – sobre a relatividade e o efeito fotoelétrico –, um retorno positivo de Einstein a respeito do formalismo de Carathéodory com certeza poderia ter proporcionado a esse assunto uma recepção diferente da comunidade da física. Mas, apesar da solicitação de Born, não constam nas posteriores correspondências entre Born e Einstein [19] qualquer menção desse último a questão do trabalho de Carathéodory. Posteriormente, e ainda sobre a sua tentativa de popularizar o trabalho de Carathéodory, a frustração de Born se confirma quando ele afirma, se referindo por método clássico ao que chamamos aqui de formalismo de Clausius: My interpretation of Carathéodory’s thermodynamics did not have the effect I had hoped for of displacing the classical method which, in my opinion, is both clumsy and mathematically opaque. (Minha interpretação da termodinâmica de Carathéodory não obteve o efeito que eu esperava de substituir o método clássico que, na minha opinião, é desajeitado e matematicamente opaco.) (19 – p. 55) Após Born, possíveis empecilhos para com o uso e a divulgação do formalismo de Carathéodory foram investigados por diversos outros autores. Nesse contexto, além da aparente má sorte histórica que citamos, obstáculos pedagógicos e matemáticos que podem ter contribuído para a impopularidade do formalismo de Carathéodory foram apontados por Zemansky [20], em 1966. Zemansky escreveu que para a apresentação da segunda lei da termodinâmica: Due to the fact that Carathéodory’s axiom was not based directly on experience and that the proof of his theorem was longwinded and difficult, most physicists and textbook writers ignored the Carathéodory treatment […] (Devido ao fato de que o axioma de Carathéodory não era baseado diretamente da experiência e de que a prova do seu teorema era longa e difícil, a maioria dos físicos e escritores de livros-texto ignorou o tratamento de Carathéodory […]) (20 – p. 915) Curiosamente, anteriormente ao relato de Zemansky já haviam trabalhos que solucionavam as questões que ele apontava. Por exemplo, em 1964, Landsberg [21] provou que o axioma de Carathéodory pode ser deduzido do princípio de Kelvin. Esse resultado foi melhor investigado por Titulaer e Van Kampen [22] um ano depois, em 1965. Nesse mesmo ano, Dunning-Davies [23] provou a recíproca da conclusão de Landsberg, estabelecendo a equivalência entre o axioma de Carathéodory e o princípio de Kelvin. Então, mesmo que não seja baseado diretamente de fatos experimentais, o axioma de Carathéodory se mostrou equivalente ao princípio experimental de Kelvin, de forma que o axioma de Carathéodory pode ser visto como apenas outro enunciado da segunda lei da termodinâmica [14]. Por outro lado, o teorema de Carathéodory verificou-se demonstrável com argumentos curtos, relacionados a geometria do espaço termodinâmico [14, 17, 18], bem como, relacionados ao uso do conceito de campos vetoriais [7]. Essas demonstrações, no entanto, seguem um nível de simplicidade que não contempla todo o conteúdo matemático do teorema de Carathéodory na sua versão geral, como mostrou Boyling [24]. Todavia, para o ensino da termodinâmica clássica, as justificativas dadas pelos autores acima citados na demonstração desse teorema são, como propõem-se a ser, suficientes, e não prejudicam o seguimento dos resultados físicos da teoria [14]. Contudo, como já está claro, a superação desses dois empecilhos apontados por Zemansky ao formalismo de Carathéodory não bastou para fazer com que esse formalismo se difundisse posteriormente no meio da física. Mas então haveria alguma outra grande dificuldade, além daquelas originalmente apontadas por Zemansky, para com o uso do formalismo de Carathéodory? E em particular no âmbito da apresentação da segunda lei da termodinâmica? Defendemos com este artigo que não. E, assim, objetivamos introduzir alguns dos métodos e significados do formalismo de Carathéodory ao leitor, especificamente no contexto da apresentação da segunda lei da termodinâmica. Logo, nas seções seguintes, buscamos apresentar ao leitor, didaticamente, os esforços que citamos relacionados a conectar o axioma de Carathéodory com o princípio de Clausius e o princípio de Kelvin. Como um resultado novo a partir da ampla literatura revisada neste artigo, provamos a dedução direta do axioma de Carathéodory a partir do princípio de Clausius. A seção 3 trata da dedução do axioma de Carathéodory a partir do princípio de Kelvin, conforme Titulaer e Van Kampen [22]. Já a seção 4 trata da nossa dedução do axioma de Carathéodory a partir do princípio de Clausius. Consideramos serem essas etapas as mais importantes ao leitor no que se refere à conexão do formalismo de Carathéodory com a segunda lei da termodinâmica. Em seguida, procurando contribuir em alguma medida para com a popularização do formalismo de Carathéodory em cursos de termodinâmica clássica em nível de graduação, mostramos ao leitor na seção 5 um vislumbre de como a entropia e o conteúdo matemático da segunda lei da termodinâmica surgem como consequência direta da aplicação do teorema de Carathéodory. Para isso, o teorema de Carathéodory foi demonstrado na subseção 5.1 de forma simples, a partir do argumento de Born [17]. Já a entropia em si foi abordada logo após, na subseção 5.2. Também, para uma boa compreensão do que segue, basta ao leitor o conhecimento básico dos conceitos fundamentais da termodinâmica clássica: sistema e vizinhança; reservatório térmico, equilíbrio e espaço termodinâmico; coordenadas, estado e processos termodinâmicos; primeira e segunda lei da termodinâmica, etc. Porém, sempre que necessário, por uma questão de ênfase, faremos uma breve discussão de alguns desses conceitos. Por fim, este artigo não possui o intuito de defender a superioridade do formalismo de Carathéodory com relação aos outros formalismos da termodinâmica clássica. Portanto, tentamos aqui apenas indicar a possibilidade do uso do formalismo de Carathéodory no ensino da termodinâmica clássica. discutimos um pouco da origem e do teor do formalismo de Carathéodory no contexto da sua impopularidade histórica ao longo dos anos. Advogamos pelo formalismo de Carathéodory ao fomentá-lo como uma alternativa viável ao ensino da termodinâmica clássica.

Em favor dessa causa, buscamos mostrar didaticamente ao leitor como o axioma de Carathéodory da segunda lei da termodinâmica pode ser deduzido dos princípios de Clausius e Kelvin: mostramos (K) ⇒ (AC) na seção 3 3. Axioma de Carathéodory a Partir do Princípio de Kelvin Existem algumas diferenças na literatura quanto à redação dos princípios experimentais da segunda lei da termodinâmica. Assim, mesmo que meramente relacionadas a uma escolha de palavras ligeiramente distintas por cada autor, essas diferenças podem causar confusões na interpretação dos enunciados desses princípios [25]. Buscando evitar essas situações, este artigo enunciará tanto o axioma de Carathéodory, quanto os princípios de Clausius e Kelvin, conforme encontra-se no livro clássico An Introduction to the Study of Stellar Structure, do ganhador do Nobel de Física de 1983, Subrahmanyan Chandrasekhar. Segue então o princípio de Kelvin, conforme Chandrasekhar [13]: In a cycle of processes it is impossible to transfer heat from a heat reservoir and convert it all into work, without at the same time transferring a certain amount of heat from a hotter to a colder body. (Em um ciclo de processos é impossível transferir calor de um reservatório térmico e convertê-lo totalmente em trabalho, sem ao mesmo tempo transferir uma certa quantidade de calor de um corpo mais quente para um mais frio.) ([13] – p. 24) O que o princípio de Kelvin – que se mencionará daqui em diante, de forma abreviada, por (K) – diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema converta totalmente calor 𝒬 absorvido de um reservatório térmico em trabalho W sem que, durante o mesmo ciclo, haja também calor cedido do sistema para outro sistema à temperatura mais baixa. Em outras palavras, seja 𝒬 o calor absorvido por um sistema a partir de um reservatório térmico durante um ciclo termodinâmico qualquer, e seja W o trabalho relacionado à interação do sistema com a sua vizinhança durante esse ciclo. Então, por (K), a seguinte igualdade ao final do ciclo é impossível, com 𝒬⊤′ (1) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Observe que (K) destacadamente trabalha com os conceitos de calor, trabalho, e temperatura, de forma a priori. Ou seja, nesse enunciado da segunda lei da termodinâmica, calor, trabalho, e temperatura, são conceitos termodinâmicas elementares. Entendido (K), segue o axioma de Carathéodory, também conforme Chandrasekhar [13]: Arbitrarily near to any given state there exist states which cannot be reached from an initial state by means of adiabatic processes. (Arbitrariamente próximo a qualquer estado existem estados que não podem ser alcançados a partir de um estado inicial por meio de processos adiabáticos.) ([13] – p. 24) Há muito para se comentar sobre o axioma de Carathéodory – que se mencionará daqui em diante, de forma abreviada, por (AC) – contudo, inicialmente, faz-se necessário o entendimento da palavra estado nesse contexto. A termodinâmica clássica lida com sistemas macroscópicos em situações de equilíbrio, ou seja, em situações em que as coordenadas, ou variáveis, termodinâmicas do sistema estão bem definidas. Com efeito, quando estabelecido o equilíbrio, analogamente ao caso da mecânica clássica, temos a caracterização completa do sistema termodinâmico pelo valor das suas coordenadas termodinâmicas independentes. E, quando isso é feito, o estado do sistema está definido e é expresso pelo conjunto dessas coordenadas termodinâmicas independentes que caracterizam o equilíbrio. Logo, para a termodinâmica clássica, situações de equilíbrio equivalem a definição do estado do sistema termodinâmico. Dito isso, vamos ao conteúdo de (AC). O que (AC) estabelece é que, dado um estado qualquer de um sistema termodinâmico, existirão outros estados que o sistema não pode alcançar por meio de processos adiabáticos. Processos adiabáticos são processos que ocorrem sem trocas de energia na forma de calor entre o sistema e a sua vizinhança. Observe que (AC) não faz distinção entre processos reversíveis ou irreversíveis. Perceba aqui que (AC) pressupõe como maior conceito termodinâmico elementar a noção de processo adiabático. Essa construção se faz presente no formalismo de Carathéodory com o objetivo de fugir do conceito direto de fluxo de calor, trocando-o pela ideia de processos não puramente mecânicos.4 Mas, para de fato entendermos o enunciado de (AC) precisamos analisar o significado do termo “alcançar” que nele consta. Para sair de um estado para outro, o sistema termodinâmico precisa realizar um processo e então chegar a uma nova situação de equilíbrio, configurando assim um novo estado termodinâmico. Dizer que existem estados que não podem ser “alcançados” por processos adiabáticos significa dizer que existem situações de equilíbrio que não podem ser obtidas se usarmos como caminho para isso um processo adiabático. Dito de outra forma, dado um estado qualquer de um sistema termodinâmico, não podemos submeter o sistema a processos adiabáticos arbitrários. Buscamos agora mostrar que (K) ⇒ (AC). Para isso é suficiente mostrarmos que se (AC) é falso, (K) também é.5 Então, conforme Titulaer e Van Kampen [22], provamos primeiro que (K) ⇒ (AC) para processos reversíveis. Processos reversíveis são, como o próprio nome sugere, processos passíveis de serem executados em ambas as “direções temporais”, uma vez que todas as situações do sistema durante esses processos são situações de equilíbrio. Por exemplo, se pudermos conceber um sistema constituído de um gás confinado em um recipiente limitado por um êmbolo móvel sem atrito, poderemos abaixar o êmbolo depositando grãos de areia um por um sobre ele, comprimindo assim o gás no recipiente de forma reversível, de modo que o gás sempre se manterá em equilíbrio nesse processo. Por outro lado, se retirarmos os grãos de areia de cima do êmbolo um a um, poderemos, em algum momento, retornar a exata mesma situação de equilíbrio que iniciamos esse raciocínio, retornando o gás ao seu estado termodinâmico original. Esse comportamento temporal reversível define os processos reversíveis. Por isso, processos reversíveis são representados por curvas contínuas no espaço termodinâmico. Assim, seja um espaço termodinâmico que define os estados termodinâmicos para um sistema termodinâmico modelo com um conjunto usual de três coordenadas termodinâmicas independentes: θ, a temperatura empírica do sistema, mensurada por algum instrumento de medida, em alguma escala de temperatura; x1 e x2, duas coordenadas relacionadas ao comportamento mecânico do sistema termodinâmico. Por exemplo, sendo x1 = V e x2 = M, respectivamente o volume e a magnitude da magnetização do sistema. A escolha por três coordenadas independentes para a caracterização do sistema termodinâmico modelo em discussão se faz, simplesmente, pela facilidade inicial de se trabalhar em três dimensões. No entanto, naturalmente, o que será argumentado a seguir vale também para um número maior de coordenadas termodinâmicas. Esse espaço termodinâmico, representado na Fig. 1, caracteriza um estado termodinâmico qualquer pelos valores mensurados das coordenadas (θ,x1,x2), por exemplo: (θ0,x10,x20). Por consequência, tal estado é univocamente identificado como um ponto A no referido espaço tal que, A=(θ0,x10,x20). Figura 1 Espaço termodinâmico das coordenadas θ, x1 e x2. Além disso, por estarmos tratando de sistemas termodinâmicos, sempre se faz possível a escolha da temperatura empírica como uma das coordenadas termodinâmicas independentes. Em seguida, seja 𝒫 o seguinte ciclo reversível dado no espaço termodinâmico da Fig. 1 e representado na Fig. 2. Figura 2 Ciclo reversível 𝒫 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. Uma vez que 𝒫 é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido A→B→B′→A. O ciclo reversível 𝒫 da Fig. 2 é montado de tal forma que: o processo A→B é supostamente adiabático, logo 𝒬A→B = 0; o processo B→B′ não foge da linha que preserva os valores de x1=x1* e x2=x2*, logo não há trabalho envolvido de B para B′, porém há calor absorvido 𝒬B→B′ > 0 de B para B′ graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo B′→A é também supostamente adiabático, logo 𝒬B′→A = 0. Isso fecha o ciclo 𝒫. Para esse ciclo que construímos é importante percebermos que, como 𝒫 é reversível, toda essa construção idealizada para 𝒫 poderia ser invertida, invertendo o ciclo e tomando ao contrário B′→B tal que, nesse sentido, haveria calor cedido 𝒬B′→B < 0 de B′ para B. Porém, um olhar mais cuidadoso sobre o ciclo 𝒫 que construímos revela que se ele for possível, então (AC) é falso. Com efeito, pode-se aproximar B′ de B de forma abitrária. Ademais, como 𝒫 é reversível, tanto o processo adiabático A→B quanto o processo adiabático A→B′ podem ser realizados. Mas, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′por processos adiabáticos reversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos reversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Mas como não temos até agora justificativas reais – físicas – para a validade de (AC), suponhamos que 𝒫 é de fato possível e então (AC) é mesmo falso. Vamos agora aplicar a primeira lei da termodinâmica em 𝒫. Isso nos fornece, graças à aditividade da energia (2) Δ ⁢ E 𝒫 = Δ ⁢ E A → B + Δ ⁢ E B → B ′ + Δ ⁢ E B ′ → A . Uma vez que 𝒫 é um ciclo termodinâmico, ΔE𝒫 = 0. Aplicando as características de 𝒫 em (2), temos (3) - W A → B + 𝒬 B → B ′ - W B ′ → A = 0 . Observe que as contribuições algébricas efetivas das quantidades de trabalho que aparecem em 𝒫 estão relacionadas à realização de trabalho do sistema na vizinhança, ou da vizinhança no sistema. Então, a expressão (3) pode ser reorganizada. Nomeando de W o trabalho efetivo envolvido no percurso de 𝒫, temos (4) 𝒬 ⁢ = ⁢ 𝒲 ⁢. Mas isso é análogo ao que diz a equação (1) e assim a equação (4), que vem da hipótese de (AC) ser falso, falseia (K). Logo, para processos reversíveis (K) ⇒ (AC). Porém, sabemos que também lidamos com processos irreversíveis na termodinâmica clássica. Esses processos são, como o próprio nome sugere, processos que apenas podem ser realizados em uma única “direção temporal”, uma vez que as situações intermediárias do sistema em um processo irreversível não são situações de equilíbrio. Mesmo sendo a termodinâmica clássica uma teoria que estuda apenas as situações de equilíbrio, nela uma análise qualitativa dos processos irreversíveis é também possível. Isso se deve ao fato de que, na termodinâmica clássica, as situações iniciais e finais dos processos irreversíveis são sempre situações de equilíbrio. Além do mais, é dos processos irreversíveis que emerge o verdadeiro significado da entropia e da segunda lei da termodinâmica. Em termos do espaço termodinâmico, processos irreversíveis não podem ser representados como curvas contínuas usuais nesse espaço, ao contrário de como são os processos reversíveis. Assim, como apenas estão definidos os estados inicial e final de um processo irreversível, costuma-se representá-lo como uma linha tracejada no espaço termodinâmico, conectando os seus estados inicial e final. É natural que busquemos avaliar a relação (K) ⇒ (AC) também para processos irreversíveis. Assim, sejam os ciclos irreversíveis 𝒫1 e 𝒫2 no mesmo espaço termodinâmico anterior da Fig. 1, representados, respectivamente, na Fig. 3 e na Fig. 4. Figura 3 Ciclo irreversível 𝒫1 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B é irreversível. Logo, 𝒫1 só pode ser realizado no sentido A→B→B′→A. Figura 4 Ciclo irreversível 𝒫2 construído através de processos intermediários entre os pontos A, B e B′ no espaço termodinâmico. O processo intermediário A→B′ é irreversível. Logo, 𝒫2 só pode ser realizado no sentido A→B′→B→A. Os ciclos 𝒫1 e 𝒫2 são construídos de forma análoga aquela posta para o ciclo 𝒫 no caso reversível. No ciclo 𝒫1: o processo irreversível A→B é supostamente adiabático, então 𝒬A→B = 0; o processo reversível B→B′ se mantém na linha em que x1=x1* e x2=x2*, então WB→B′ = 0, porém 𝒬B→B′ > 0 graças a diferença de temperatura entre B e B′, θ∗∗−θ∗ > 0; por último, o processo reversível B′→A é também supostamente adiabático, então 𝒬B′→A = 0. Isso fecha o ciclo 𝒫1. Deve-se destacar que graças à irreversibilidade de 𝒫1 o mesmo somente pode ser percorrido no sentido A→B→B′→A. Similarmente, no ciclo 𝒫2: o processo irreversível A→B′ é supostamente adiabático, então 𝒬A→B′ = 0; o processo reversível B′→B se mantém na linha em que x1=x1* e x2=x2*, então WB′→B = 0, porém 𝒬B′→B < 0 graças a diferença de temperatura entre B′ e B, θ∗−θ∗∗ < 0; por último, o processo reversível B→A é também supostamente adiabático, então 𝒬B→A = 0. Isso fecha o ciclo 𝒫2. Da mesma forma que para o ciclo 𝒫1, graças à irreversibilidade de 𝒫2 o mesmo somente pode ser percorrido no sentido A→B′→B→A. Agora, suponha que ambos os ciclos irreversíveis 𝒫1 e 𝒫2 sejam simultaneamente possíveis, ou seja, ambos os ciclos possam ser realizados. Ocorre que, se esse for o caso, então (AC) é falso. Com efeito, novamente, aproximamos B′ de B de forma arbitrária. Ademais, se supormos serem 𝒫1 e 𝒫2 simultaneamente possíveis, então como consequência ambos os processos irreversíveis A→B e A→B′ são também possíveis. Então, se B′ é aproximado arbitrariamente de B, e a partir de A se pode alcançar tanto B quanto B′ por processos adiabáticos irreversíveis, então a partir de A todos os estados na mesma linha x1*⁢x2* de B e B′ podem ser alcançados por processos adiabáticos irreversíveis. Logo, aproximando também a linha x1*⁢x2* arbitrariamente de A, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, (AC) para processos irreversíveis. Nesse ponto, em comparação com o argumento do caso reversível, o leitor atento já deve ter percebido qual será o próximo passo que deve ser dado. Novamente, a princípio não temos nenhum argumento físico que impeça (AC) de ser falso no caso irreversível. Logo, suponha que (AC) é mesmo falso e então 𝒫1 e 𝒫2 são simultaneamente possíveis. Em seguida, repetindo o argumento do caso reversível e aplicando a primeira lei da termodinâmica tanto em 𝒫1 quanto em 𝒫2, temos que, ao final de cada um desses ciclos (5) 𝒬 ⁢ = ⁢ 𝒲. Na expressão (5) 𝒬 é o calor absorvido, ou cedido, pelo sistema em interação com um reservatório térmico apropriado para cada um dos ciclos, e W é o trabalho efetivo relacionado à s interações do sistema com a sua vizinhança também para cada um dos ciclos. Assumindo que 𝒫1 e 𝒫2 são simultaneamente possíveis, fica claro que uma igualdade análoga à expressão (5) poderia ser escrita para cada um desses ciclos irreversíveis: uma em que W = 𝒬⊤′ ao final do ciclo, relacionada com o ciclo 𝒫1, e uma em que W = 𝒬ℜ′ ao final do ciclo, relacionada com o ciclo 𝒫2. A primeira igualdade falseia (K), uma vez que ela exprimi exatamente o mesmo conteúdo da expressão (1), que é proibida por (K). Logo, para processos irreversíveis (K) ⇒ (AC). Uma argumentação direta para essa conclusão pode ser encontrada no capítulo 5 do livro do Landsberg [15]. Algumas considerações devem ser feitas sobre esse resultado. Observe que a verdadeira fenomenologia por trás de (K) em conexão com (AC) apenas é revelada a partir do estudo dos processos irreversíveis. Já que, se (K) tratasse da impossibilidade de ao final de um ciclo termos W = 𝒬ℜ′, ao invés de W = 𝒬⊤′, nada seria alterado na nossa análise do caso reversível para mostrarmos que (K) ⇒ (AC). A retirada dessa aparente ambiguidade matemática do estudo reversível de (K) apenas ocorre com a análise dos processos irreversíveis, revelando o verdadeiro caráter físico de (K). Para evitar nos estendermos em demasia nessa discussão, a argumentação quanto a recíproca dessa relação entre (AC) e (K) não será apresentada aqui; porém, ela é curta, e pode ser consultada no artigo de Dunning-Davies [23]. , e (C) ⇒ (AC) na seção 4 4. Axioma de Carathéodory a Partir do Princípio de Clausius Apresentamos agora nossa prova da dedução do axioma de Carathéodory a partir do princípio de Clausius. Igualmente como foi feito na seção anterior, estabelecemos o princípio de Clausius, conforme Chandrasekhar [13]: It is impossible that, at the end of a cycle of changes, heat has been transferred from a colder to a hotter body without at the same time converting a certain amount of work into heat. (É impossível que, ao final de um ciclo de mudanças, calor tenha sido transferido de um corpo mais frio para um corpo mais quente sem que ao mesmo tempo se converta uma certa quantidade de trabalho em calor.) ([13] – p. 24) Busquemos realizar uma análise semelhante para o princípio de Clausius – que se mencionará daqui em diante, de forma abreviada, por (C) – daquela que fizemos para (K) na seção anterior. O que (C) diz é que, durante um ciclo termodinâmico qualquer, não é possível que um sistema absorva uma certa quantidade de calor 𝒬 de um corpo a uma temperatura mais baixa que a do sistema e, em seguida, transfira integralmente essa mesma quantidade de calor 𝒬 para um corpo a uma temperatura mais alta que a do sistema, sem que, durante esse ciclo, haja a conversão de alguma quantidade de trabalho W em calor adicional. Aqui, os corpos mencionados, cujo sistema entra em contato no ciclo descrito, são corpos que preservam as suas respectivas temperaturas quando interagem com o sistema. Isso torna implícito que esses corpos em contato com o sistema que realiza o ciclo são reservatórios térmicos. Então, no esquema do princípio de Clausius, temos um reservatório térmico com uma temperatura mais baixa que a temperatura do sistema, e um reservatório térmico com uma temperatura mais alta que a temperatura do sistema. Esses reservatórios térmicos estudados costumeiramente recebem o sugestivo nome de fontes térmicas; fonte fria para o reservatório térmico sob temperatura mais baixa que a do sistema, e fonte quente para o reservatório térmico sob temperatura mais alta que a do sistema. Ou seja, suponha que um sistema descreve um ciclo termodinâmico que absorve uma certa quantidade de calor 𝒬f de uma fonte fria, e então rejeita uma outra certa quantidade de calor 𝒬q para uma fonte quente, sem que haja nesse ciclo qualquer realização de trabalho efetivo para que seja convertido em calor adicional. Por (C), a seguinte igualdade ao final do ciclo é impossível (6) | 𝒬 f | = | 𝒬 q | . Isto é, ao final do ciclo não podemos ter a igualdade entre as magnitudes das quantidades de calor que foram absorvidas e rejeitadas, respectivamente, da fonte fria, e para a fonte quente. Em (6) devemos escrever o módulo das quantidades de calor no ciclo, pois, em função da interação com o sistema, calor rejeitado para uma fonte é, naturalmente, algebricamente negativo. Assim, já familiarizados com o conteúdo de (AC), desejamos mostrar que (C) ⇒ (AC). Como antes, para isso é suficiente mostrarmos que se (AC) é falso, (C) também é. Vamos mostrar uma prova para essa relação primeiramente para processos reversíveis. Então, seja primeiro 𝒫′ o ciclo reversível representado na Fig. 5 e dado no mesmo espaço termodinâmico que já estamos habituados a trabalhar, para o mesmo sistema termodinâmico modelo anteriormente utilizado. Observe que 𝒫′ percorre o ciclo de pontos B→C→D→A→B no espaço termodinâmico. O trecho A→B′→B e o ciclo 𝒫″ que percorre os pontos B′→B→C→D→A→B′, a princípio não fazem parte do que estamos considerando na Fig. 5. Figura 5 Ciclo reversível 𝒫′ construído através de processos intermediários entre os pontos A, B, C e D no espaço termodinâmico. Uma vez que 𝒫′ é reversível, o sentido de percurso no ciclo pode ser escolhido arbitrariamente. Escolhe-se aqui o sentido B→C→D→A→B. O trecho A→B′→B será discutido posteriormente. Construímos o ciclo reversível 𝒫′ da Fig. 5, percorrendo o ciclo de pontos B→C→D→A→B, de modo que o sistema descreve, durante 𝒫′: o processo B→C, cuja temperatura θ∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a absorção de uma certa quantidade de calor 𝒬B→C > 0 do sistema a partir da vizinhança; o processo C→D, que é supostamente adiabático, logo 𝒬C→D = 0; o processo D→A, cuja temperatura θ∗∗ se mantém constante durante o contato do sistema com a vizinhança, mas há a rejeição de uma certa quantidade de calor 𝒬B→C < 0 do sistema para a vizinhança; por fim, o processo A→B, que é também supostamente adiabático, logo 𝒬A→B = 0. Isso fecha o ciclo 𝒫′. Aqui, algumas considerações importantes devem ser notadas: i) a princípio nada impede que um ciclo como 𝒫′ seja construído, ii) em geral durante 𝒫′ temos |𝒬B→C|≠|𝒬D→A|, com trabalho efetivo sendo convertido em calor adicional, iii) os processos intermediários B→C e D→A de 𝒫′, ao preservarem a temperatura do sistema em contato com a sua vizinhança, indicam que durante esses processos o sistema está em contato com fontes térmicas, sendo que naturalmente a fonte fria é aquela à temperatura θ∗ e a fonte quente é aquela à temperatura θ∗∗, e iv) como 𝒫′ é reversível, toda essa construção idealizada para 𝒫′ poderia ser invertida, invertendo o ciclo e tomando ao contrário uma absorção de calor da fonte quente, e uma rejeição de calor para a fonte fria. Em seguida, notamos o ciclo 𝒫″, que pode também ser visto na Fig. 5 e percorre o ciclo de pontos B′→B→C→D→A→B′ no espaço termodinâmico. Em 𝒫″ o ponto B′ foi escolhido de tal modo que tenhamos |𝒬B′→C| = |𝒬D→A| durante a realização de 𝒫″, com o processo intermediário A→B′ também supostamente adiabático. Dada a possibilidade irrestrita da ocorrência de 𝒫′, se for também verdade que 𝒫″ é possível nos moldes do que foi construído, então significa que os processos adiabáticos A→B′ e A→B são simultaneamente possíveis. Entretanto, se A→B′ e A→B forem simultaneamente possíveis, então (AC) é falso. De fato, podemos aproximar B′ de B de forma arbitrária. E, se supormos 𝒫″ possível, os processos adiabáticos reversíveis A→B′ e A→B se tornam simultaneamente possíveis. Se também aproximarmos arbitrariamente a linha de pontos no espaço termodinâmico cuja temperatura é θ∗, da linha de pontos cuja temperatura é θ∗∗, teríamos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos reversíveis, falseando, assim, (AC) para processos reversíveis. Contudo, podemos ver que se assumirmos a falsidade de (AC), a execução de 𝒫″ nos dá de imediato a falsidade de (C). Com efeito, se (AC) é falso então A→B′ e A→B são simultaneamente possíveis, em particular 𝒫″ é possível, e como consequência durante 𝒫″ (7) | 𝒬 B ′ → C | = | 𝒬 D → A | . O que fornece, pela expressão (7), o mesmo que a expressão (6), que é proibida por (C). Logo, para processos reversíveis (C) ⇒ (AC). Espera-se naturalmente que (C) ⇒ (AC) também para o caso irreversível. De fato, uma argumentação quanto a validade da relação (C) ⇒ (AC) para processos irreversíveis se dá de forma natural a partir do que já foi mostrado com a análise análoga de que (K) ⇒ (AC) para o caso irreversível. Para essa argumentação seria necessária a construção de dois ciclos irreversíveis semelhantes a 𝒫′ e 𝒫″, tais que naquele análogo a 𝒫′ o processo A→B seria supostamente adiabático e irreversível, e naquele análogo a 𝒫″ o processo A→B′ seria supostamente adiabático e irreversível. Os outros processos desses ciclos seriam reversíveis. Em seguida, tomaríamos a hipótese de serem esses ciclos irreversíveis construídos simultaneamente possíveis. Assim, repetindo a mesma análise e verificando conclusões similares aquelas obtidas no caso irreversível da relação (K) ⇒ (AC), mostraríamos que, para não violar (C), (AC) também é verdadeiro para processos irreversíveis. Para evitar a repetição desses mesmos passos e das mesmas argumentações já feitas anteriormente, o que tornaria desnecessariamente maçante a discussão aqui realizada, essa etapa não será desenvolvida no presente artigo. . Da ampla literatura revisada, demos uma prova nova para (C) ⇒ (AC).

Além disso, guiamos o leitor na seção 5 5. Caminho Para a Entropia Agora, munidos da validade do axioma de Carathéodory, deduzido dos princípios de Clausius e Kelvin nas seções anteriores, e do conteúdo do teorema de Carathéodory, que veremos a seguir, mostraremos como obter a entropia e o conteúdo matemático da segunda lei da termodinâmica a partir do formalismo de Carathéodory. Com esse objetivo em mente, precisaremos antes falar um pouco de alguns aspectos formais do formalismo de Carathéodory. Buscando aliar detalhamento, fluidez e caráter didático na presente seção, a dividimos em duas subseções: uma, a 5.1, para tratar da matemática em si e do teorema usado no formalismo de Carathéodory, e outra, a 5.2, para tratar de um caminho6 possível para a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica por esse formalismo. 5.1. Requisitos matemáticos e teorema deCarathéodory O primeiro dos aspectos formais do formalismo de Carathéodory que devemos estudar é a interpretação matemática que esse formalismo dá para as coordenadas termodinâmicas. Grandezas como a temperatura empírica θ, o volume V, entre outras, as quais usualmente damos o nome de coordenadas termodinâmicas quando caracterizam o estado de um sistema termodinâmico, aparecem no formalismo de Carathéodory em uma perspectiva formal que traça um grande paralelo com o conceito das coordenadas generalizadas da mecânica clássica [14], que caracterizam um sistema mecânico. Outras grandezas relacionadas a um sistema termodinâmico, como o calor 𝒬, o trabalho W, e a energia E, são identificadas no formalismo de Carathéodory como uma espécie de função generalizada das coordenadas termodinâmicas. Matematicamente, as coordenadas termodinâmicas se expressam como quantidades xi, onde o índice i varia conforme o número de coordenadas termodinâmicas em análise. Já para as funções generalizadas das coordenadas termodinâmicas que anunciamos, escrevemos que elas são funções χi = χi(xj), onde o índice j nos diz que as χi não são necessariamente funções que dependem de todas as coordenadas termodinâmicas consideradas. E é justamente por esse fato que as χi não são sempre funções de estado no sentido de caracterizarem o estado de um sistema termodinâmico. Uma vez que elas não contêm necessariamente uma dependência com todas as coordenadas termodinâmicas que definem esse estado. Um exemplo de uma função χi que é de fato uma função de estado é a energia E de um sistema termodinâmico, uma vez que ela possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já um exemplo de uma função χi que não é uma função de estado é o calor 𝒬, que está relacionado as interações do sistema termodinâmico com a sua vizinhança e assim não possui dependência com todas as coordenadas termodinâmicas que definem o estado desse sistema. Já perceba aqui a distinção física que esse formalismo nos fornece ao nos dizer matematicamente que a energia é uma função de estado do sistema e, portanto, está vinculada diretamente a caracterização do seu estado, ao passo que o calor não é. Ou seja, a introdução dessas ideias já deixa claro que um sistema termodinâmico pode possuir energia, mas não pode possuir calor, ao passo que esse último depende do processo termodinâmico realizado. Seguindo em frente nessa discussão, o que vemos na termodinâmica clássica com frequência é (8) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i . A análise cuidadosa da expressão (8) é crucial para o que segue7. O que (8) diz é que a soma do produto entre as funções generalizadas χi e os infinitésimos das coordenadas termodinâmicas nos dá um infinitésimo de alguma função generalizada χ∗ particular. Ou seja, na termodinâmica clássica os infinitésimos das χi se dão por expressões análogas aquela em (8). Tratando sobre os símbolos usados em (8), ambos δ e d remetem a quantidades infinitesimais. Mas, como de costume na física, para uma quantidade infinitesimal que caracteriza uma diferencial exata8 reservamos o símbolo d. Do contrário, damos o símbolo δ para uma quantidade infinitesimal que não é necessariamente uma diferencial exata, e a chamamos de diferencial inexata. Se a quantidade δχ∗ é uma diferencial exata, substituímos o símbolo δ pelo usual d e temos que a função generalizada χ∗ é na verdade uma função de estado, possuindo dependência com todas as coordenadas termodinâmicas xi. Esse caso torna a expressão (8) mais familiar, quando temos (9) d ⁢ χ * = ∑ i = 1 n ∂ ⁡ χ * ∂ ⁡ x i ⁢ d ⁢ x i . Isto é, nesse caso as χi são as derivadas parciais de χ∗ em relação as coordenadas termodinâmicas xi e a função de estado χ∗ pode ser obtida via uma integração comum9 desde a expressão (8). Novamente, exemplificando, e pelo que já discutimos anteriormente, temos como um exemplo imediato de uma grandeza termodinâmica que define uma diferencial exata a energia, e como uma que não o calor. Um teste que sempre podemos aplicar para verificarmos se a quantidade δχ∗ é uma diferencial exata ou não é o de avaliarmos, nas funções generalizadas χi de δχ∗ em (8), se (10) ∂ ⁡ χ k ∂ ⁡ x l = ∂ ⁡ χ l ∂ ⁡ x k com ( k , l = 1 , 2 , … , n ) . O teste da equação (10) avalia se as derivadas parciais cruzadas de quaisquer pares (χk,χl) das χi, para com o correspondente par das coordenadas termodinâmicas (xl,xk) com naturalmente (k,l = 1,2,…,n), são identicamente iguais entre si. O leitor pode reconhecer que esse teste decorre do teorema de Clairaut-Schwarz, do cálculo diferencial de várias variáveis. Se a equação (10) for satisfeita para quaisquer par de índices, (k,l = 1,2,…,n), a quantidade δχ∗ será uma diferencial exata. Em seguida, queremos também dar uma atenção especial a situação importante na qual a expressão (8) se anula, ou seja, quando (11) δ ⁢ χ * = ∑ i = 1 n χ i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Para a equação definida em (11) damos aqui o nome10 de equação diferencial associada a δχ∗. É importante observarmos que as soluções dessas equações diferenciais associadas as δχ∗ serão sempre um conjunto de valores das coordenadas termodinâmicas, o que pode ser visualizado, na perspectiva geométrica do espaço termodinâmico, como um conjunto de pontos dados por esses valores das coordenadas termodinâmicas nesse espaço. Em especial, quando δχ∗ é uma diferencial exata, esse conjunto de pontos no espaço termodinâmico que forma as soluções da equação diferencial associada a δχ∗ = 0 é, a partir da equação (11) (12) χ * = χ * ⁢ ( x 1 , x 2 , … , x n ) = c . Onde na equação (12) c é uma constante. A equação (12) é uma hipersuperfície de n dimensões no espaço termodinâmico com n coordenadas termodinâmicas. Então, fixada uma hipersuperfície χ∗(x1,x2,…,xn) = c, para um determinado valor de c, naturalmente se estabelecem as soluções de (12), que são hipercurvas nesse espaço. A princípio abstrata, essa conclusão se materializa muito mais intuitivamente quando trabalhamos com três coordenadas termodinâmicas e então a equação (12) se traduz em uma familiar superfície em 3 dimensões, χ∗(x1,x2,x3) = c, no espaço termodinâmico tridimensional relacionado. Além disso, as soluções de χ∗(x1,x2,x3) = c se tornam curvas nesse espaço. Vale destacar que é a partir de três coordenadas termodinâmicas que costumamos modelar e estudar a maioria dos sistemas termodinâmicos da termodinâmica clássica em nível de graduação. Finalmente, antes de falarmos do teorema de Carathéodory, precisamos tratar de quando a quantidade δχ∗ em (8) não constitui uma diferencial exata, porém, passa a constituir quando é multiplicada por uma determinada função, a qual chamamos de fator integrante. Com efeito, análoga as χi, seja η uma função generalizada qualquer das coordenadas termodinâmicas que a princípio não é uma diferencial exata, logo o infinitésimo de η é δη. Acontece que, em alguns casos, quando multiplicamos δη por uma outra função generalizada μ das coordenadas termodinâmicas, obtemos a validade da seguinte relação (13) d ⁢ σ = μ ⁢ δ ⁢ η . Ou seja, em alguns casos, podemos multiplicar uma diferencial inexata δη por uma função generalizada apropriada das coordenadas termodinâmicas μ, para assim obtermos uma diferencial exata dσ. Quando isso acontece, dizemos que δη é uma diferencial inexata integrável por μ, daí o nome sugestivo de fator integrante para μ. Essa ação, dada em (13), também é chamada de integrar a equação diferencial associada a δη. E sendo δη uma diferencial inexata integrável, as soluções da sua respectiva equação diferencial associada também são da forma da expressão (12). Mas em quais casos podemos fazer essa integração? A menos dos casos restritos a duas ou três coordenadas termodinâmicas em estudo,11 o resultado que generaliza a resposta para essa pergunta, e dá significado físico a toda essa construção matemática anterior, é o teorema de Carathéodory. Segue, então, o teorema de Carathéodory, adaptado à notação do presente artigo, a partir do que consta no livro clássico de termodinâmica clássica The Concepts of Classical Thermodynamics, do H. A. Buchdahl [14]: If every neighbourhood of any arbitrary point A contains points B inaccessible from A along solutions curves of the equation ∑i=1nχi⁢(xj)⁢d⁢xi=0, then the equation is integrable. (Se cada vizinhança de qualquer ponto arbitrário A contém pontos B inacessíveis de A ao longo das curvas soluções da equação ∑i=1nχi⁢(xj)⁢d⁢xi=0, então a equação é integrável.) ([14] – p. 62) Antes de provarmos o teorema de Carathéodory, vamos evidenciar para o leitor o conteúdo físico familiar que ele possui a partir do axioma de Carathéodory, que já discutimos exaustivamente nas seções 3 e 4. Primeiro, vamos recapitular que o calor 𝒬 relacionado a um sistema termodinâmico é aqui identificado matematicamente como uma função generalizada das coordenadas termodinâmicas conforme (8), logo para n coordenadas termodinâmicas xi quaisquer, temos (14) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i . Naturalmente, com a respectiva equação diferencial associada a 𝒬, dada por (15) δ ⁢ 𝒬 = ∑ i = 1 n 𝒬 i ⁢ ( x j ) ⁢ d ⁢ x i = 0 . Observe que a equação (15) já nos fornece, precisamente, a descrição matemática de um processo adiabático infinitesimal. Agora, se traduzirmos e aplicarmos o teorema de Carathéodory para 𝒬, e para os pontos do espaço termodinâmico de quaisquer n coordenadas termodinâmicas que quisermos estudar, poderemos escrever que: se qualquer vizinhança de qualquer ponto A contém pontos B inacessíveis por A a partir das curvas soluções da equação δ𝒬 = 0, então essa equação é integrável. Mas, notamos aqui uma congruência entre a premissa do teorema de Carathéodory aplicado a 𝒬, e o axioma de Carathéodory, que relembramos novamente ao leitor, já traduzindo-o para o contexto do espaço termodinâmico12: Axioma de Carathéodory. arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos. E, como também lembramos, processos adiabáticos são processos nos quais a equação (15) ocorre em toda a sua execução. Além disso, perceba que um processo adiabático é exatamente o conceito físico que matematicamente se representa nesse formalismo por meio das curvas soluções da equação (15). Em outras palavras, processos adiabáticos são as curvas soluções da equação (15). Observe a elegante distinção, e ao mesmo tempo conexão, que faz o formalismo de Carathéodory entre a substância física e a substância matemática da termodinâmica clássica. Assim, reescrevemos o teorema de Carathéodory da seguinte forma: se arbitrariamente próximo de qualquer ponto dado existem pontos inacessíveis desde um ponto inicial por meio de processos adiabáticos, então, a equação δ𝒬 = 0 é integrável. Ou, resumindo: Teorema de Carathéodory. se vale o axioma de Carathéodory, então δ𝒬 = 0 é integrável. O teorema de Carathéodory fala em termos matemáticos quando uma equação do tipo (11) é integrável, e o axioma de Carathéodory aponta em termos físicos que o calor sempre é. Por mera simplicidade inicial, provamos o teorema de Carathéodory para três coordenadas termodinâmicas quaisquer (x1,x2,x3). Como havíamos anunciado anteriormente, seguimos os argumentos de Born [17]. Prova. Considere que, como nossa hipótese inicial, o axioma de Carathéodory vale. Ou seja, considere que um ponto arbitrário B no espaço termodinâmico em 3 dimensões é inacessível desde um ponto também arbitrário A, o quão próximo sejam B e A, pelas soluções de δ𝒬 = 0nesse espaço. Digamos agora que exista um segundo ponto arbitrário C acessível a A por δ𝒬 = 0. Então A e C são acessíveis um ao outro pelas soluções de δ𝒬 = 0. Mas C tem que ser também inacessível a B por essas soluções de δ𝒬 = 0, pois, do contrário, através da passagem por C, B seria acessível a A, o que contradiz a nossa hipótese inicial. Logo, os pontos acessíveis a A definem uma superfície no espaço termodinâmico contendo A tal que essa superfície também contém todos os pontos acessíveis a A pelas soluções de δ𝒬 = 0. Agora, como essa propriedade da inacessibilidade de pontos no espaço foi exemplificada por A, com A arbitrário, ela deve valer também para qualquer outro ponto nesse espaço termodinâmico. Definindo, assim, para cada ponto escolhido, e pelo fato de sempre existirem pontos arbitrariamente próximos ao ponto que se escolha, uma superfície no espaço tridimensional, σ(x1,x2,x3) = c, que contém todos os respectivos pontos acessíveis desde o ponto arbitrário escolhido. Existem assim, como consequência da nossa hipótese da inacessibilidade, e de existirem pontos inacessíveis arbitrariamente próximos do ponto que seja escolhido, várias superfícies vizinhas que não se interceptam13, Σ(x1,x2,x3) = c, contendo os pontos que são acessíveis entre si. Nessas superfícies temos que ter dσ = 0 e δ𝒬 = 0, donde concluímos que δ𝒬 e dσ devem ser quantidades proporcionais nessas superfícies. Isto é, existe μ = μ(x1,x2,x3) tal que (16) d ⁢ σ = μ ⁢ δ ⁢ 𝒬 . ■ Para o caso geral de n coordenadas termodinâmicas a argumentação acima é a mesma, trocando-se apenas o termo e a construção de superfícies pela generalização de hipersuperfícies. Segue da prova acima que a escrita de μ como uma quantidade que se relaciona com as diferenciais dσ e δ𝒬 exatamente como da forma expressa na equação (16) não é obrigatória. Em outras palavras, segundo o teorema de Carathéodory, matematicamente apenas precisamos que μ expresse a proporcionalidade que existe entre dσ e δ𝒬. Dessa forma, por razões que ficaram claras mais à frente, escreveremos para δ𝒬 e dσ, ao invés da equação (16), a seguinte expressão (17) δ ⁢ 𝒬 = μ ⁢ d ⁢ σ . Observe nesse ponto uma das características marcantes do formalismo de Carathéodory: ambiguidades e conclusões matemáticas gerais estarão, necessariamente, sujeitas à s avaliações físicas do seu significado. Vamos agora, no intuito de entender melhor a igualdade (17) e obter a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo aqui desenvolvido, buscar estudar melhor o fator integrante μ e a função de estado σ que recém descobrimos. 5.2. Entropia e temperatura absoluta Com o objetivo de obtermos a entropia e o conteúdo matemático da segunda lei da termodinâmica pelo formalismo de Carathéodory, devemos analisar a situação de dois sistemas termodinâmicos em contato puramente térmico um com o outro, bem como isolados adiabaticamente da vizinhança que os cerca. E, nesse ponto, voltaremos a tratar de um número n de coordenadas termodinâmicas quaisquer para os sistemas termodinâmicos em estudo, assumindo a validade do teorema de Carathéodory também para esse caso geral. Considere então dois sistemas termodinâmicos, que iremos nos referir como KA e KB, em contato puramente térmico entre si, ou seja, KA e KB podem interagir apenas via trocas de calor. Além disso, como dissemos, KA e KB estão isolados adiabaticamente da vizinhança que os cerca. Se olharmos para o conjunto KA e KB de forma global, poderemos dizer que ambos os sistemas formam um sistema termodinâmico composto KC. Observando esse sistema composto KC, em termos matemáticos, temos (18) δ ⁢ 𝒬 C = δ ⁢ 𝒬 A + δ ⁢ 𝒬 B . Quando estabelecido o equilíbrio térmico entre KA e KB, ambos os sistemas individuais terão a mesma temperatura empírica θ ao final de um determinado tempo,14 que também será naturalmente a mesma temperatura empírica do sistema composto KC no equilíbrio. Agora, sendo (x1,x2,…,xn−1,θA), (y1,y2, …,yn−1, θB), e (x1,x2,…,xn−1, y1, y2,…,yn−1, θA,θB), as respectivas coordenadas termodinâmicas de KA, KB e KC, teremos, no equilíbrio térmico, θA = θB = θ. As coordenadas xi e yi são as coordenadas termodinâmicas que fornecem o comportamento mecânico dos respectivos sistemas KA e KB. Essas constatações serão importantes mais adiante. Ao aplicarmos a equação (17) na equação (18), temos, de imediato (19) μ C ⁢ d ⁢ σ C = μ A ⁢ d ⁢ σ A + μ B ⁢ d ⁢ σ B . Reorganizando (19) em termos de dσC, obtemos (20) d ⁢ σ C = μ A μ C ⁢ d ⁢ σ A + μ B μ C ⁢ d ⁢ σ B . Como justificado pelo teorema de Carathéodory, as quantidades σ que surgem da integração de quantidades δ𝒬 são funções de estado e, portanto, são funções de todas as coordenadas termodinâmicas que caracterizam o estado de um sistema termodinâmico. Pela expressão (20), vemos também que σC = σC(σA,σB). Ou seja, podemos escrever (21) d ⁢ σ C = ∂ ⁡ σ C ∂ ⁡ σ A ⁢ d ⁢ σ A + ∂ ⁡ σ C ∂ ⁡ σ B ⁢ d ⁢ σ B . Tal que, comparando as expressões (21) e (20), temos (22a) μ A μ C = ∂ ⁡ σ C ∂ ⁡ σ A ; (22b) μ B μ C = ∂ ⁡ σ C ∂ ⁡ σ B . As equações (22) nos dizem que os quocientes μAμC e μBμC são tais que (23a) μ A μ C = μ A μ C ⁢ ( σ A , σ B ) ; (23b) μ B μ C = μ B μ C ⁢ ( σ A , σ B ) . Mas, sabemos que a princípio, pelo teorema de Carathéodory, as quantidades μ são funções das coordenadas termodinâmicas definidoras dos estados dos seus respectivos sistemas termodinâmicos progenitores, isto é, e já para o equilíbrio térmico entre KA e KB (24a) μ A = μ A ⁢ ( x 1 , x 2 , … , x n - 1 , σ A , θ ) ; (24b) μ B = μ B ⁢ ( y 1 , y 2 , … , y n - 1 , σ B , θ ) ; (24c) μ C = μ C ⁢ ( x 1 , … , x n - 1 , y 1 , … , y n - 1 , σ A , σ B , θ ) . Dessa forma, atente que para conciliarmos as equações (24) e (23) as quantidades μ não devem depender das suas respectivas coordenadas termodinâmicas que fornecem o comportamento mecânico do respectivo sistema relacionado com μ. Do contrário, os quocientes dados nas equações (23) não poderiam depender somente das quantidades σ. Logo, por essa análise, a forma mais geral das quantidades μ deve ser15 (25a) μ A = μ A ⁢ ( σ A , θ ) = t ⁢ ( θ ) ⁢ f A ⁢ ( σ A ) ; (25b) μ B = μ B ⁢ ( σ B , θ ) = t ⁢ ( θ ) ⁢ f B ⁢ ( σ B ) ; (25c) μ C = μ C ⁢ ( σ A , σ B , θ ) = t ⁢ ( θ ) ⁢ f C ⁢ ( σ A , σ B ) . Observe que, apenas graças ao equilíbrio térmico entre os sistemas KA e KB conseguimos escrever as equações (25), que mostram que os fatores integrantes μ podem ser escritas com relação a uma função de caráter universal16 t = t(θ), independente do sistema termodinâmico, que depende unicamente da temperatura empírica θ do equilíbrio entre KA e KB e que, portanto, é comum a ambos os sistemas KA e KB. O teor universal dessa função t = t(θ) nos motiva a definir a chamada temperatura absoluta T dos sistemas termodinâmicos [28], a menos de uma constante arbitrária k, de modo que (26) T = k ⁢ t ⁢ ( θ ) . O sinal algébrico da constante arbitrária k que define a temperatura absoluta na equação (26) é uma convenção,17 e o formalismo de Carathéodory deixa isso bem claro. A escolha histórica foi a de k > 0. Ademais, foi para obtermos essa direta proporcionalidade entre as escalas de temperatura T e t(θ) dada em (26) que escolhemos trabalhar com a equação (17), ao invés da equação (16). Isso sugere para a temperatura absoluta os mesmos métodos experimentais que são usados para a determinação da temperatura empírica, como discutido por Buchdahl [14]. Se substituirmos o resultado das equações (25), em conjunto com a equação (26), na equação (17), teremos, para um sistema termodinâmico qualquer (27) δ ⁢ 𝒬 = T k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Isolando os termos de (27) com a dependência em σ (28) δ ⁢ 𝒬 T = 1 k ⁢ f ⁢ ( σ ) ⁢ d ⁢ σ . Já sabemos que a quantidade σ é uma função de estado, como também é, por exemplo, a energia E de um sistema termodinâmico. Chamamos então a função σ de entropia empírica, em alusão a sua relação com a temperatura empírica de um sistema termodinâmico. Em seguida, definimos (29) d ⁢ 𝒮 ≡ ∞ ∥ ⁢ { ⁢ ⇐ ⁢ σ ⁢ ⇒ ⁢ ⌈ ⁢ σ ⁢ . A quantidade 𝒮 é claramente também uma função de estado, e recebe o nome de entropia absoluta, ou apenas entropia do sistema termodinâmico, também em alusão a sua relação com a temperatura absoluta. A mensuração da entropia também independe das propriedades particulares de cada sistema termodinâmico. Finalmente, substituindo a equação (29) na equação (28), obtemos (30) d ⁢ 𝒮 ⁢ = ⁢ δ ⁢ 𝒬 𝒯 ⁢ . A expressão (30) é o conteúdo matemático da segunda lei da termodinâmica para processos reversíveis. O motivo de (30) valer apenas para processos reversíveis fica claro na medida em que tentamos avaliar a entropia 𝒮 desde (30) para processos irreversíveis. Se tentarmos fazer isso, veremos de imediato que uma simples integração de d𝒮 não é possível para obtermos 𝒮 em processos irreversíveis. Para essa integração, a temperatura absoluta T em (30) nem mesmo estaria definida nas etapas intermediárias de qualquer processo irreversível que considerássemos avaliar. Isso quer dizer que precisamos de uma outra estratégia para estudarmos 𝒮 em processos irreversíveis. Contudo, felizmente, o axioma de Carathéodory nos fornece essa outra estratégia rapidamente. Para isso, considere, novamente por pura simplicidade, um espaço termodinâmico com três coordenadas termodinâmicas, x1,x2 e 𝒮. Em seguida, considere o esquema desse espaço termodinâmico na Fig. 6 com dois processos supostamente adiabáticos irreversíveis, 𝒫⇓ e 𝒫↖, partindo ambos do mesmo ponto arbitrário A. Figura 6 Espaço termodinâmico das coordenadas x1,x2 e 𝒮, com os processos supostamente adiabáticos irreversíveis 𝒫⇓ de A→B′, e 𝒫↖ de A→B. Feito isso, suponha ambos esses processos, 𝒫⇓ e 𝒫↖, simultaneamente possíveis. Então, a variação da entropia no curso desses dois processos poderá ser, a partir da Fig. 6, positiva ou negativa. Positiva durante 𝒫⇓, negativa durante 𝒫↖. Mas, podemos aproximar arbitrariamente B′ de B, e como supomos 𝒫⇓ e 𝒫↖ simultaneamente possíveis, segue que todos os pontos na linha que contém B e B′ podem ser alcançados desde A por processos adiabáticos irreversíveis. Aproximando também a linha que contém B e B′ de A, teremos que: arbitrariamente próximo de A existem estados que podem ser alcançados a partir de A por processos adiabáticos irreversíveis, falseando, assim, o axioma de Carathéodory para processos irreversíveis. Decorre dessa argumentação o seguinte: para não violar o axioma de Carathéodory, a entropia de qualquer sistema termodinâmico no curso de um processo adiabático irreversível sempre deve ou aumentar ou diminuir, nunca os dois [28]. Mais uma vez aqui, e talvez de forma ainda mais importante, o formalismo de Carathéodory nos impeli a observar a distinção entre a substância física da termodinâmica clássica e a construção matemática desenvolvida para descrevê-la. Ou seja, a escolha para o sinal algébrico da variação da entropia em processos adiabáticos irreversíveis se torna arbitrária. Como o leitor já deve saber, escolhemos o sinal positivo para essa variação e escrevemos (31) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ > 0 . A expressão em (30) é o conteúdo matemático da segunda lei da termodinâmica para processos irreversíveis. Juntando as expressões (30) e (31), quando tomamos um processo adiabático em (30), obtemos (32) Δ ⁢ 𝒮 𝒬 ⁢ = ⁢ ′ ⩾ 0 . A expressão (32) é o conteúdo matemático geral da segunda lei da termodinâmica. Por último, gostaríamos que o leitor se ativesse a observar a essência do formalismo de Carathéodory. Nele, apesar do investimento matemático que é necessário, a física da termodinâmica clássica é amplamente refletida e solicitada, ao passo que a construção matemática distingue, com precisão, o conteúdo físico da teoria do puramente formal e abstrato. O formalismo de Carathéodory ainda fornece uma vasta margem de conexão pedagógica entre a termodinâmica clássica e a mecânica clássica, a partir do conceito de coordenadas generalizadas, conforme aponta Buchdahl [14]. Ainda, ao sermos capazes de reproduzir os resultados da termodinâmica clássica simplesmente assumindo de início a validade do axioma de Carathéodory, traçamos um paralelo entre esse axioma e aquele encontrado no formalismo de Hamilton – princípio de Hamilton –, novamente no contexto da mecânica clássica, como diz Pippard [29]. Ou seja, apesar do infortúnio da impopularidade do formalismo de Carathéodory ao longo dos anos, essa abordagem pode, definitivamente, acrescentar muito para com o ensino da termodinâmica clássica, e pode ser utilizada como uma alternativa viável aos formalismos de Clausius e Gibbs. por um dos caminhos possíveis que levam a obtenção da entropia e do conteúdo matemático da segunda lei da termodinâmica a partir desse formalismo. Desse modo, esperamos que este trabalho sirva em alguma medida para popularizar o formalismo de Carathéodory em disciplinas de termodinâmica clássica em nível de graduação, contribuindo também com o ensino da própria termodinâmica clássica.

Agradecimentos

Agradecimentos se destinam aos professores Paulo Henrique Ribeiro Peixoto, do NFD-UFPE, e Gustavo Camelo Neto, do NICEN-UFPE. Agradecimentos também se devem aos revisores do artigo pelas valorosas críticas e sugestões.

References

  • 1.
    I. Müller, A History of Thermodynamics: The Doctrine of Energy and Entropy (Springer, Berlin, 2007).
  • 2.
    M.J. Oliveira, Equilibrium Thermodynamics (Springer, Berlin, 2017), 2ª ed.
  • 3.
    J.W. Gibbs, The Collected Works of J. Willard Gibbs. Volume I: Thermodynamics (Longmans, London, 1928).
  • 4.
    H. Callen, Thermodynamics and an Introduction to Thermostatistics (Wiley, New York, 1985), 2ª ed.
  • 5.
    E.A. Guggenheim, Thermodynamics: An Advanced Treatment for Chemists and Physicists (North-holland, Amsterdam, 1986), 8ª ed.
  • 6.
    M.J. Oliveira, Rev. Bras. Ens. Fís. 41, e20180174 (2019).
  • 7.
    J.H. Luscombe, Thermodynamics (CRC Press, Boca Raton, 2018).
  • 8.
    A. Thess, The Entropy Principle: Thermodynamics for the Unsatisfied (Springer, New York, 2011).
  • 9.
    E.H. Lieb e J. Yngvason, Physics Reports 310, 1 (1999).
  • 10.
    C. Carathéodory, Math. Ann. 67, 355 (1909).
  • 11.
    L. Tisza, Generalized Thermodynamics (MIT Press, Massachusetts, 1966).
  • 12.
    F.W. Sears, Am J Phys 34, 665 (1966).
  • 13.
    S. Chandrasekhar, An Introduction to the Study of Stellar Structure (Dover Publications, New York, 1939).
  • 14.
    H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).
  • 15.
    P.T. Landsberg, Thermodynamics and Statistical Mechanics (Dover Publications, New York, 2014).
  • 16.
    J. Dunning-Davies, Concise Thermodynamics: Principles and Applications in Physical Science and Engineering (Woodhead Publishing Limited, Sawston, 2007), 2ª ed.
  • 17.
    M. Born, Physik. Z. 22, 282 (1921).
  • 18.
    M. Born, Natural Philosophy of Cause and Chance (Clarendon Press, Oxford, 1949).
  • 19.
    M. Born, A. Einstein e H. Born, The Born-Einstein Letters (The MacMillan Press, London, 1971).
  • 20.
    M.W. Zemansky, Am J Phys 34, 914 (1966).
  • 21.
    P.T. Landsberg, Nature 201, 485 (1964).
  • 22.
    U.M. Titulaer e N.G. Van Kampen, Physica 31, 1029 (1965).
  • 23.
    J. Dunning-Davies, Nature 208, 576 (1965).
  • 24.
    J.B. Boyling, Comm. Math. Phys. 10, 52 (1968).
  • 25.
    J. Dunning-Davies, arXiv:1103.4360 (2011).
  • 26.
    I. Sneddon, Elements of Partial Differential Equations (McGraw-Hill, NewYork, 2006).
  • 27.
    M.W. Zemansky e R. Dittman, Heat and Thermodynamics (McGraw-Hill, New York, 1997), 7ª ed.
  • 28.
    W. Pauli, Thermodynamics and the Kinetic Theory of Gases: Volume 3 of Pauli Lectures on Physics (Dover Publications, New York, 1973).
  • 29.
    A.B. Pippard, The Elements of Classical Thermodynamics (Cambridge University Press, London, 1957).
  • 1
    Luscombe apresenta em seu livro uma abordagem moderna do formalismo de Carathéodory, trabalhando-o com o conceito de campos vetoriais.
  • 2
    O trabalho de Carathéodory é um marco histórico no que se refere à s bases descritivas de uma termodinâmica clássica analítica [88. A. Thess, The Entropy Principle: Thermodynamics for the Unsatisfied (Springer, New York, 2011)., 99. E.H. Lieb e J. Yngvason, Physics Reports 310, 1 (1999).].
  • 3
    A totalidade dos resultados esperados da termodinâmica não surge do formalismo de Carathéodory. O mesmo é também verdade para o formalismo de Clausius. O maior exemplo disso é a terceira lei da termodinâmica, cujo conteúdo preciso e completo somente pode ser obtido pelo advento da mecânica quântica. Sem essa inclusão, ambos os formalismos produzem o conteúdo da terceira lei da termodinâmica de forma ad hoc. Nesse sentido, podemos dizer que esses formalismo nos fornecem aquilo que seria esperado como o conteúdo matemático clássico da teoria. Para mais detalhes quanto a esse assunto, sugerimos ao leitor a consulta do livro de Tisza [1111. L. Tisza, Generalized Thermodynamics (MIT Press, Massachusetts, 1966).].
  • 4
    Para um amplo tratamento dessa questão, sugerimos ao leitor a consulta da seção 8 do livro do Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).].
  • 5
    Em outras palavras, se for verdade que a negação de (AC) fornece a negação de (K), então, uma vez que (K) é verdadeiro, (AC) também o será.
  • 6
    Existem outros caminhos possíveis para isso 77. J.H. Luscombe, Thermodynamics (CRC Press, Boca Raton, 2018)., 1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966)., 1515. P.T. Landsberg, Thermodynamics and Statistical Mechanics (Dover Publications, New York, 2014)., 1616. J. Dunning-Davies, Concise Thermodynamics: Principles and Applications in Physical Science and Engineering (Woodhead Publishing Limited, Sawston, 2007), 2ª ed..
  • 7
    Um nome elegante para as quantidades expressas por (8) é o de formas diferenciais pfaffianas [2626. I. Sneddon, Elements of Partial Differential Equations (McGraw-Hill, NewYork, 2006).]. Porém, por se tratar apenas de um termo técnico, e que pouco acrescentaria à discussão do material deste artigo, não usamos dessa nomenclatura. Para o leitor que queira se aprofundar na rica teoria matemática das formas diferenciais pfaffianas, sugerimos a consulta do livro do Sneddon [2626. I. Sneddon, Elements of Partial Differential Equations (McGraw-Hill, NewYork, 2006).]
  • 8
    Ou seja, uma quantidade infinitesimal cuja variação somente depende dos seus valores inicial e final.
  • 9
    Com δχ definindo uma diferencial exata , a tomada da sua integral não precisa especificar nenhum conjunto particular de valores das coordenadas termodinâmicas, o que definiria um caminho para que a integração seja feita. Nesse caso, a integração de avalia apenas os valores inicial e final de χ.
  • 10
    Essas equações são costumeiramente chamadas de equações diferenciais de Pfaff [2626. I. Sneddon, Elements of Partial Differential Equations (McGraw-Hill, NewYork, 2006).].
  • 11
    Sugerimos a leitura do livro do Buchdahl [1414. H.A. Buchdahl, The Concepts of Classical Thermodynamics (Cambridge University Press, London, 1966).] para o leitor que deseje estudar esses casos mais simples de forma aprofundada.
  • 12
    Lembre-se, já justificamos a relação unívoca entre estados termodinâmicos e pontos no espaço termodinâmico.
  • 13
    Essa verificação é simples, conforme discute Landsberg [1515. P.T. Landsberg, Thermodynamics and Statistical Mechanics (Dover Publications, New York, 2014).].
  • 14
    De forma geral, o tempo para que o equilíbrio termodinâmico ocorra durante uma interação termodinâmica qualquer – mecânica, química, etc. – entre sistemas termodinâmicos é chamado de tempo de relaxação. Uma bela discussão sobre esse conceito em seu aspecto macroscópico pode ser encontrada no livro do Callen [44. H. Callen, Thermodynamics and an Introduction to Thermostatistics (Wiley, New York, 1985), 2ª ed.].
  • 15
    Uma argumentação mais detalhada para esse passo pode ser encontrada no artigo de Zemansky [2020. M.W. Zemansky, Am J Phys 34, 914 (1966).].
  • 16
    Devemos destacar que o formalismo de Clausius também indica que a temperatura está relacionada ao fator integrante do calor [2727. M.W. Zemansky e R. Dittman, Heat and Thermodynamics (McGraw-Hill, New York, 1997), 7ª ed.]. No formalismo de Gibbs, apesar de também presente, esse fato não é muito relevante.
  • 17
    Recomendamos fortemente ao leitor a consulta da seção 11 e dos apêndices [A-6] e [A-8] do livro do Pauli [2828. W. Pauli, Thermodynamics and the Kinetic Theory of Gases: Volume 3 of Pauli Lectures on Physics (Dover Publications, New York, 1973).], para uma esclarecedora discussão sobre esse assunto.

Datas de Publicação

  • Publicação nesta coleção
    03 Fev 2021
  • Data do Fascículo
    2021

Histórico

  • Recebido
    22 Out 2020
  • Revisado
    25 Dez 2020
  • Aceito
    28 Dez 2020
Sociedade Brasileira de Física Caixa Postal 66328, 05389-970 São Paulo SP - Brazil - São Paulo - SP - Brazil
E-mail: marcio@sbfisica.org.br