Open-access Campos clássicos no plano nulo

Classical fields on the null-plane

Resumos

A descrição da dinâmica dos sistemas físicos requer o detalhamento da evolução das quantidades que os determinam ao passar de uma superfície tri-dimensional para outra, cada uma delas definida segundo o parâmetro de evolução a que é dado o nome de «tempo». Mas quais seriam essas superfícies e qual seria esse tempo é uma escolha não única, senão diversa, como foi mostrado por Dirac em 1949; tais diferentes escolhas possíveis inequivalentes se chamam «formas dinâmicas». No presente artigo expomos a definição precisa delas e colocamos o foco de atenção na assim chamada «forma dinâmica da frente de luz» ou do «plano nulo», em que o tempo é uma coordenada definida sobre o cone de luz. Estudamos os diversos campos clássicos livres nessa formulação: o escalar, o fermiônico, o eletromagnético e o vetorial massivo, estabelecendo a solução do problema dos valores iniciais (problema de Goursat), a distinção entre suas componentes dinâmicas e as não-dinâmicas, e seus estados de polarização. Finalizamos expondo cuidadosamente as virtudes e dificuldades da forma dinâmica do plano nulo, almejando assim fornecer um material de iniciação relevante a essa prometedora, porém pouco conhecida, área da física.

Palavras-chave Teoria clássica de campos; dinâmica da frente de luz; dinâmica do plano nulo


The description of the dynamics of the physical systems requires the specification of the evolution of the quantities that determine them in passing from one three-dimensional surface to the other, each one of them defined by the constant value of a parameter called «time». But such surfaces and such time can be chosen in different manners, as it was shown by Dirac in 1949; the inequivalent possible choices are called «dynamical forms». In this study we precisely define them, focusing in particular in the so-called «light-front dynamics» or «null-plane dynamics», in which the time is a coordinate defined on the light-cone. We study the classical free fields in this formulation: the scalar, fermion, electromagnetic and massive vector ones, establishing the solution to their initial-value problem (Goursat’s problem), the classification of their components as dynamical and non-dynamical, and their polarization states. We finalize by highlighting the advantages and disadvantages of null-plane physics, hoping to provide a relevant initiation material to this promising, although generally unknown, area of physics.

Keywords Classical field theory; light-front dynamics; null-plane dynamics


1. Introdução

Quando se diz da descrição física de um determinado fenômeno ao que se quer indicar é ao conhecimento da evolução das grandezas observáveis que o determinam. Essas grandezas mudam segundo a dinâmica particular do fenômeno e, assim, é necessário referi-las a algum parâmetro ao que chamamos «tempo». Na nossa concepção popular, que tem lugar no espaço-tempo absoluto de Newton, o tempo é um conceito primitivo assim como o é o espaço. Disto não temos dúvida porque nessa descrição a cada tempo só pode corresponder um único valor dos observáveis, uma vez que em cada instante a partícula somente pode se encontrar em um único ponto e não em outro. Tal segurança, no entanto, é substituída pela dúvida uma vez que nos defrontamos com os conceitos da teoria da relatividade de Poincaré-Einstein [1, 2, 3, 4]. Esta é a teoria do espaço-tempo em que todos os sistemas inerciais de referência se equivalem, formulada de forma compatível com o fato experimentalmente provado da constância da velocidade da luz no vácuo. Ela impõe um limite às velocidades das partículas, restringe seu movimento e, em correspondência, levanta a possibilidade da foliação do espaço-tempo por superfícies diferentes daquela que usávamos na teoria newtoniana: Compensa, por assim dizer, a restrição do movimento incrementando as possibilidades de sua descrição.

O aparecimento de novas possibilidades para descrever a dinâmica o podemos entender fácilmente no contexto da mecânica do ponto, em que todas as grandezas físicas associadas a ele estão concentradas no próprio ponto e ele, então, descreve uma trajetória de evolução que é uma «linha de mundo». Em semelhante situação, a restrição que permite a completa descrição do sistema é que a mencionada linha de mundo só possa atravessar a superfície isocrônica uma única vez. Veremos a seguir quais são as superfícies que possuem esta característica.

Na dinâmica newtoniana a partícula pode ter velocidade qualquer. Assim sendo, num diagrama tversusx, a linha de mundo da partícula pode adotar coeficiente angular (inclinação) não-negativa qualquer.1 Portanto, é possível que uma partícula atravesse uma superfície inclinada no espaço tx mais de uma vez, caso for acelerada suficientemente, como temos desenhado na figura 1(b), e isto acontecerá sem importar quão pequena seja a inclinação do plano. Em semelhante situação, a partícula poderia ser encontrada em mais de um ponto em cada tempo, e sua descrição se tornaria impossível. Concluindo, na dinâmica newtoniana a única forma dinâmica possível é a «dinâmica instantânea», na qual as superfícies isocrônicas são superfícies de tempo (newtoniano) constante, como mostrado na figura 1(a).

Figura 1
(a) Superfície de tempo constante. (b) Superfície inclinada.

Na dinâmica relativística não enfrentamos o problema de velocidades infinitas que limitava as possíveis descrições no caso não-relativístico. Com efeito, agora a linha de mundo das partículas está restrita pela causalidade a estar sempre dentro do cone de luz, em cada ponto dela; ou seja, num diagrama tx, o coeficiente angular da linha de mundo, em cada ponto, não pode ser menor do que a unidade – ou menor do que 1/c, onde c é a velocidade da luz no espaço vazio–. Quem primeiro se perguntou pela possibilidade de escolha das superfícies isocrônicas nessa situação foi Dirac em 1949 [6]; mais adiante detalharemos seus raciocínios. Ele conseguiu encontrar três formas dinâmicas relativísticas, a saber:

  • (a)

    Dinâmica instantânea: Aquela em que as superfícies redisocrônicas são superfícies de coordenada x0 constante, essa coordenada sendo o tempo. Esta é a mesma forma da dinâmica newtoniana, a mais amplamente usada. Ela se mostra na figura 2(a).

    Figura 2
    (a) Dinâmica instantânea. (b) Dinâmica forma-ponto. (c) Dinâmica da frente de luz.

  • (b)

    Dinâmica forma-ponto: Nessa forma dinâmica, que se mostra na figura 2(b), as superfícies isocrônicas são os ramos superiores dos hiperboloides a2 = x2, o parâmetro a2 sendo o tempo da teoria. Nota-se que no caso limite a2 = 0, os hiperboloides degeneram no cone de luz.

  • (c)

    Dinâmica da frente de luz:2 Aqui as superfícies isocrônicas são planos nulos de coordenada x+x0 + x3 constante, sendo ela o tempo da teoria, como se mostra na figura 2(c).

Tal como temos apresentado, à pergunta de Dirac temos dado, como ele mesmo o fez, uma resposta intuitiva: Não temos usado um método para encontrar essas formas dinâmicas e não sabemos se elas são as únicas ou se existem outras, nem abordamos tampouco o problema de sua equivalência, de suas possibilidades e limitações. Mas já podemos perceber que a transição da multiplicidade de escolhas na dinâmica relativística à unicidade da newtoniana seria assim: O limite não-relativístico das novas formas dinâmicas é a dinâmica instantânea, pois as superfícies isocrônicas, quer os hiperboloides, quer os frentes de luz, se aproximam das superficies de x0 constante no limite c → + ∞, visto que o próprio cone de luz se abre infinitamente, fazendo os hiperboloides perderem sua curvatura na dinâmica forma-ponto e os planos nulos perderem sua inclinação na dinâmica da frente de luz; por isto, o limite não-relativístico não constitui um motivo de preferência da dinâmica instantânea sobre as outras formas dinâmicas: No mundo não-relativístico é impossível diferenciar uma da outra; a finitude de c não «faz aparecer» novas formas dinâmicas, mas levanta a degenerescência entre elas.

Após o trabalho de Dirac, as formas dinâmicas por ele descobertas foram muito pouco estudadas. Mas vários anos depois, na segunda metade da década de 1960, a forma dinâmica da frente de luz reapareceu de forma totalmente independente –e com nomes diferentes como já veremos– como um método a ser usado na solução de dois problemas. Apareceu primeiramente em 1965 no trabalho de Fubini e Furlan [17] em álgebra de correntes, sob o nome de «sistema de referência de momento infinito», pois a ele tinham chegado por um processo de limite de um sistema de referência se movimentando com velocidade próxima à da luz. Este trabalho iniciou uma linha de pesquisa à qual se aderiram, por exemplo, Weinberg [18] e Bebié e Leutwyler [19]. O outro problema em que essa forma dinâmica se mostrou vantajosa foi no estudo do campo do laser; isto ocorreu em 1967 durante os estudos de doutorado de Neville sob a orientação de Rohrlich [15, 20, 21]. Nesses dois problemas, insistimos, a dinâmica da frente de luz foi usada como uma ferramenta para a fenomenologia, sem referência nenhuma ao artigo de Dirac. Mas a conexão entre estes trabalhos não tardou em ser reconhecida: Chang e Ma [22], em 1969, publicaram um artigo em que se estudava o modelo de interação φ3, assim como a eletrodinâmica quântica (QED) nas novas variáveis da frente de luz; nele foi dito pela primeira vez que o sistema de referência de momento infinito correspondia-se com a forma dinâmica da frente de luz de Dirac. Por outro lado, em 1970 Kogut e Soper [23] interpretaram o passo ao sistema de referência de momento infinito como uma mudança de variáveis equivalente à formulação no plano nulo de Rohrlich e Neville. Dessarte, podemos afirmar que a dinâmica da frente de luz foi descoberta três vezes de forma independente: Primeiro em 1949 por Dirac, em 1965 por Fubini e Furlan, e em 1967 por Neville e Rohrlich, e que elas foram identificadas como uma e a mesma nos trabalhos de Chang e Ma e de Kogut e Soper.

A partir desse ponto a física no plano nulo começou a ser mais estudada: O problema dos valores iniciais para os campos clássicos foi estudado por Rohrlich e Neville [15, 24], que estabeleceram teoremas de existência e unicidade das soluções para o campo escalar de Klein-Gordon-Fock, para o campo de Dirac e para o campo eletromagnético sujeito à condição de gauge do plano nulo A+ = 0, aduzindo importantes razões para seu uso. O plano nulo encontrou importante aplicação desde seu nascimento na teoria ondulatória (quântica), em que destacam, entre outros, o trabalho de Leutwyler, Klauder e Streit [25] sobre questões teóricas da quantização, o de Ten Eyck e Rohrlich [26, 27] e Chang, Root e Yan [28, 29, 30, 31] sobre a equivalência da QED no plano nulo com a QED na forma instantânea, o trabalho sobre renormalização da QED por Brodsky, Roskies e Suaya [32] e na área mais fenomenológica o uso que a ela deram Drell, Levy e Yan [33, 34, 35, 36] no modelo a pártons.

Com o renascimento do estudo das formas dinâmicas impulsionado pela física no plano nulo advieram igualmente trabalhos de pesquisa na forma dinâmica da forma-ponto –uma revisão pode ser encontrada na Ref. [37]–.

Em 1978, as três soluções encontradas por Dirac foram complementadas por importantes pesquisadores na área da física no plano nulo. Para tal foi usado o método exposto por Dirac no artigo original, que foi definir as superfícies isocrônicas em relação ao subgrupo do grupo de Poincaré que as deixa invariantes –chamado «grupo de estabilidade» da superfície–; embora Dirac tenha estabelecido suas soluções «à mão», na década de 1970 havia sido feita uma classificação dos subgrupos do grupo de Poincaré [9, 10, 11, 12], o que possibilitou fazer rigoroso o método de Dirac; Leutwyler e Stern [13] encontraram mais duas formas dinâmicas, cujas superfícies isocrônicas são definidas como (d) os ramos superiores dos hiperbolóides de equação (x0)2 − (x1)2 − (x2)2 = a2, e (e) os dos hiperbolóides que seguem a lei (x0)2 − (x3)2 = a2; em ambos os casos, semelhantemente à forma-ponto, ao parâmetro a2 é dada a função de tempo. Leutwyler e Stern mostraram ainda que as cinco formas dinâmicas agora conhecidas são as únicas possíveis que satisfazem a imposição da transitividade do grupo de estabilidade das superfícies isocrônicas, isto é, que todo ponto da superfície pode ser conectado com qualquer outro ponto nela por algum elemento do grupo de estabilidade. Essas novas formas dinâmicas, também, degeneram na dinâmica instantânea no limite não-relativístico.

É claro que todas essas formas dinâmicas requerem atenção e estudo, embora os autores não conheçam o trabalho realizado em alguma das duas novas formas dinâmicas adicionadas por Leutwyler e Stern. Quanto à dinâmica da frente de luz, ela possui as seguintes peculiaridades que mostraremos mais adiante: Dirac [6] mostrou que nessa forma dinâmica o número de geradores do grupo de Poincaré independentes da interação é máximo; também, os planos nulos são as superfícies características da equação diferencial de Klein-Gordon-Fock [14, 15], equação a que todo campo deve satisfazer. Essas propriedades se oferecem à vista já na teoria clássica que é motivo do presente estudo. A esse âmbito clássico pertence também o estudo realizado por Casana, Pimentel e Zambrano [7, 8, 38] em que a estrutura de vínculos da eletrodinâmica fermiônica e a escalar, sujeitas à condição de gauge do plano nulo, é estudada na dinâmica da frente de luz usando a técnica de Dirac-Bergmann.

As aplicações mais importantes da dinâmica da frente de luz encontram-se na física hadrônica, particularmente, para a descrição de estados compostos devido à trivialidade do seu estado de vácuo na teoria quântica [13, 16]. Nesse sentido, uma técnica comumente usada é a chamada «quantização discreta no cone de luz», concebida por Maskawa e Yamawaki [39] por motivos teóricos,3 e usada na aplicação por Pauli e Brodsky [40, 41]. As teorias de gauge não-abelianas sob a condição de gauge do plano nulo foram estudadas por Tomboulis [42] na ausência de matéria e por Casher [43] em presença de férmions. Pimentel, Suzuki e Zambrano, na Ref. [44], estudaram também a estrutura de vínculos dessas teorias usando o método de integração funcional. Uma revisão dos avanços feitos na cromodinâmica quântica (QCD) no plano nulo em relação à física hadrônica pode ser encontrada na Ref. [45].

Contudo, há pontos na teoria do campo no plano nulo que se encontram ainda em discussão. A equivalência com a dinâmica instantânea, por exemplo, é ainda tema de debate, como é mostrado, por exemplo, na Ref. [46]. O mesmo acontece com os «termos instantâneos» que aparecem nos propagadores dos campos de Dirac e eletromagnético –vide, por exemplo, a Ref. [47]–.

O presente artigo é constituído da seguinte forma. Na seção 2 2. Definição algébrica das formas dinâmicas Nessa seção introduziremos as diversas formas dinâmicas seguindo as idéias apresentadas por Dirac [6], que colocou o problema da seguinte forma: Duas teorias, a relatividade de Poincaré-Einstein, que exige a invariância da física frente às transformações do grupo de Poincaré, e a mecânica quântica, cuja estrutura é hamiltoniana,4 passaram por importantes provas experimentais. Quais serão as condições gerais que permitem a descrição de um sistema físico compatível com esses dois requerimentos simultâneamente? Comecemos com a imposição da possibilidade da formulação hamiltoniana. Essa formulação se equivale com o formalismo dos colchetes de Poisson [48, 49], segundo o qual variáveis dinâmicas quaisquer, ξ, η e ζ, devem ter colchetes de Poisson regidos pelas leis: (1) { ξ ; η } = - { η ; ξ } , (2) { ξ ; η + ζ } = { ξ ; η } + { ξ ; ζ } , (3) { ξ ; η ζ } = { ξ ; η } ζ + η { ξ ; ζ } , (4) { { ξ ; η } ; ζ } + { { η ; ζ } ; ξ } + { { ζ ; ξ } ; η } = 0 . Mas as variáveis dinâmicas estão definidas em relação ao sistema das coordenadas –exemplo disto são as próprias coordenadas e os momentos–, de forma que aquelas mudam quando essas são submetidas a uma transformação. Sob a transformação infinitesimal das coordenadas, cada variável dinâmica ξ transforma-se segundo: (5) ξ ′ = ξ + { ξ ; F } , com F alguma variável dinâmica infinitesimal, dependente apenas do sistema envolvido e da transformação de coordenadas, e ao que se dá o nome de «gerador da transformação». Essa forma da variação garante que as relações entre os colchetes de Poisson das diversas variáveis dinâmicas permaneçam inalteradas, o que permite cumprir a exigência da teoria da relatividade: «Sob as transformações do grupo de Poincaré, as variações das variáveis dinâmicas devem ser tais que os colchetes de Poisson entre elas permaneçam os mesmos». Assim, se faz necessário examinar os geradores das transformações de Poincaré. Uma transformação infinitesimal de Poincaré muda as coordenadas segundo: (6) x ′ ⁣ μ = x μ + a μ + b ⁢ x ν ν μ , com aμ os parâmetros infinitesimais da translação e bμν = − bνμ os parâmetros infinitesimais associados à transformação de Lorentz. Mantendo a discussão em nível infinitesimal, o gerador F deverá também ser linear nestes parâmetros: (7) F = - P μ ⁢ a μ + 1 2 ⁢ M μ ⁢ ν ⁢ b μ ⁢ ν ; M μ ⁢ ν = - M ν ⁢ μ . A dependência com a transformação está inclusa nos parâmetros a e b; logo as variáveis dinâmicas P e M caracterizam o sistema em estudo. Elas se chamam «quantidades fundamentais», e estão sujeitas à álgebra do grupo de Poincaré, como o demonstramos no apêndice A: (8) { P μ ; P ν } = 0 , (9) { M μ ⁢ ν ; P ρ } = - g μ ⁢ ρ P ν + g ν ⁢ ρ P μ , (10) { M μ ⁢ ν ; M ρ ⁢ σ } = - g μ ⁢ ρ M ν ⁢ σ + g ν ⁢ ρ M μ ⁢ σ - g μ ⁢ σ M ρ ⁢ ν + g ν ⁢ σ ⁢ M ρ ⁢ μ . Neste ponto, Dirac introduz a noção do que sejam as formas dinâmicas: Elas são as soluções para as relações algébricas que acabamos de escrever. Para entender o que isto quer dizer, lembre o leitor que nem todas as transformações do grupo de simetrias do espaço-tempo levam à evolução dinâmica das superfícies isocrônicas; na teoria newtoniana, por exemplo, em que o grupo de simetrias é o grupo de Galilei, uma translação espacial ou uma rotação não muda a superfície de tempo constante, apenas a transforma em si mesma, são «transformações cinemáticas» e a superfície isocrônica é estável em relação a elas. O mesmo ocorre na teoria relativística: Alguns dos geradores darão lugar a transformações cinemáticas e constituirão o «grupo de estabilidade» das superfícies isocrônicas, mapeando estas em si mesmas; os outros geradores levam a transformações que mudam a superfície, a fazem evoluir, e assim devem ser identificados com as transformações dinâmicas; a estes geradores Dirac dá o nome de «hamiltonianos». A partir daqui, já é evidente que o grupo de estabilidade e os hamiltonianos dependerão de qual seja a superfície isocrônica escolhida, e daí o interesse nas diversas formas dinâmicas: Pode acontecer –como de fato acontece, segundo comentamos na seção 1– que para alguns problemas a descrição da dinâmica seja simplificada em uma determinada forma dinâmica, pois os hamiltonianos podem ser mais simples ou mais complicados segundo a escolha da superfície isocrônica. Se tais grupos de estabilidade não são isomórficos, então as formas dinâmicas que lhes correspondem não poderão ser deformadas uma na outra por uma simples transformação de Poincaré; em tais situações, que são precisamente as que definem formas dinâmicas «diferentes», a equivalência física da descrição não se deriva do axioma da relatividade: Esse é o problema da equivalência. Para relacionar as superfícies isocrônicas com seu grupo de estabilidade, as descreveremos por meio de uma função Σ = Σ(x) cujo valor é constante nas superfícies, ou seja, ele é a expressão do «tempo» da forma dinâmica. Os geradores do grupo de estabilidade serão aqueles que satisfaçam: (11) { Σ ⁢ ( x ) ; F } = 0 , pois assim sendo, segundo a equação (5), a transformação gerada por F deixa invariante o valor do tempo Σ. Os geradores que não satisfazem à equação (11), por outra parte, serão os geradores da dinâmica. O colchete da equação (11) pode ser calculado uma vez que seja conhecida a função Σ(x) pelo uso das equações (292). Forma instantânea. Nessa forma dinâmica as superfícies isocrônicas são aquelas em que a coordenada x0 se mantém constante: (12) Σ ⁢ ( x ) = x 0 . Usando as equações (292) vemos que: (13) { x 0 ; P ρ } = - δ ρ 0 , { x 0 ; M ρ ⁢ σ } = δ ρ 0 ⁢ x σ - δ σ 0 ⁢ x ρ . O grupo de estabilidade dessas superfícies espaciais contém, como na física newtoniana, as translações e rotações espaciais, correspondentes aos geradores P1, P2, P3, M12, M23 e M31, que são, então, os geradores cinemáticos da forma instantânea. Que eles constituem uma sub-álgebra do grupo de Poincaré –e então dão origem a um de seus subgrupos– pode ser diretamente verificado com o uso das equações (8)–(10): Todos os colchetes de Poisson desses geradores têm por resultado uma expressão que contém a eles mesmos só. Os outros geradores, a saber, P0, M10, M20 e M30, são os geradores dinâmicos ou hamiltonianos. Assim, o grupo de estabilidade da forma instantânea tem dimensão sêis, e possui quatro hamiltonianos. Forma-ponto. Na forma-ponto o tempo é dado pela função: (14) Σ ⁢ ( x ) = x μ ⁢ x μ . Calculando a ação dos geradores das transformações de Poincaré sobre ela: (15) { x μ ⁢ x μ ; P ρ } = - 2 ⁢ x ρ , { x μ ⁢ x μ ; M ρ ⁢ σ } = 0 . Portanto, o grupo de estabilidade é constituído pelas transformações geradas por Mμν e tem dimensão seis, ao passo que os geradores Pμ serão os quatro hamiltonianos da forma dinâmica. Embora sejam em número igual que na forma instantânea, a forma-ponto possui a vantagem de apresentar hamiltonianos que compõem um tetra-vetor, podendo ser tratados como uma única entidade covariante. A nomeação de «forma-ponto» dada a essa dinâmica é devida à seguinte propriedade: Que seu grupo de estabilidade é o grupo de rotações tetra-dimensionais ao redor de um ponto fixo. Forma da frente de luz. Nesta forma dinâmica a superfície isocrônica é a superfície de valor constante do tempo (16) Σ ⁢ ( x ) = x + = 1 2 ⁢ ( x 0 + x 3 ) . Para ela obtemos que: (17) { x + ; P ρ } = - δ ρ + , { x + ; M ρ ⁢ σ } = δ ρ + ⁢ x σ - δ σ + ⁢ x ρ . Ocorre aqui algo curioso: Somente se a superfície for a x+ = 0, o colchete de Poisson {x+; M+ −} se anula, como se observa da equação (17). M+ −, portanto, forma parte do grupo de estabilidade da superfície x+ = 0, mas não das superfícies correspondentes a outros tempos. Restringindo nossa atenção a essa superfície particular, que sempre pode ser usada como a superfície inicial no problema de valores iniciais, teremos que o grupo de estabilidade tem dimensão sete e é formada pelos geradores P1, P2, P−, M12, M1 − , M2 − e M+ −. O número de hamiltonianos é três, e são P+, M1 + e M2 + . Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler e Stern a superfície isocrônica é definida pelo tempo: (18) Σ ⁢ ( x ) = ( x 0 ) 2 - ( x 1 ) 2 - ( x 2 ) 2 = x μ ⁢ x μ + ( x 3 ) 2 . A ação dos geradores do grupo de Poincaré sobre ela é: (19) { x μ ⁢ x μ + ( x 3 ) 2 ; P ρ } = - 2 ⁢ x ρ - 2 ⁢ x 3 ⁢ δ ρ 3 , { x μ ⁢ x μ + ( x 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ x 3 ⁢ ( δ ρ 3 ⁢ x σ - δ σ 3 ⁢ x ρ ) . Vemos assim que o grupo de estabilidade tem apenas dimensão quatro, e a ele correspondem os geradores P3, M01, M02 e M12. Os hamiltonianos dessa forma dinâmica são seis: P0, P1, P2, M03, M13 e M23. Forma de Leutwyler-Stern 2. A segunda forma introduzida por Leutwyler e Stern possui o tempo definido segundo a função: (20) Σ ⁢ ( x ) = ( x 0 ) 2 - ( x 3 ) 2 . Com o uso das equações (292) obtemos que: (21) { ( x 0 ) 2 - ( x 3 ) 2 ; P ρ } = - 2 ⁢ x 0 ⁢ δ ρ 0 + 2 ⁢ x 3 ⁢ δ ρ 3 , { ( x 0 ) 2 - ( x 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ x 0 ⁢ ( δ ρ 0 ⁢ x σ - δ σ 0 ⁢ x ρ ) - 2 ⁢ x 3 ⁢ ( δ ρ 3 ⁢ x σ - δ σ 3 ⁢ x ρ ) . Com esses resultados podemos estabelecer que o grupo de estabilidade das superfícies de Σ constante é aquele correspondente aos geradores P1, P2, M12 e M03, e portanto tem dimensão quatro. Os seis hamiltonianos dessa forma dinâmica serão os geradores P0, P3, M01, M02, M13 e M23. E isso esgota as possibilidades, uma vez que não há outro subgrupo do grupo de Poincaré com a propriedade da transitividade que possa servir como grupo de estabilidade de alguma outra superfície [9, 10, 11, 12, 13]. Os resultados que assim obtivemos da classificação algébrica das cinco possíveis formas dinâmicas na teoria relativística se resumem na tabela 1. Como podemos ver, a dinâmica da frente de luz ocupa um lugar destacado por ser a forma dinâmica com o maior grupo de estabilidade e, consequentemente, aquele com o menor número de hamiltonianos. Tabela 1 Resumo das cinco formas dinâmicas da teoria relativística. D(GΣ): Dimensão do grupo de estabilidade GΣ; N. de H’s: Número de hamiltonianos. F. dinâmica Σ(x) D(GΣ) N. de H’s Instantânea x 0 6 4 Forma-ponto x μ x μ 6 4 Frente de luz x + 7 3 L-S 1 xμxμ + (x3)2 4 6 L-S 2 (x0)2 − (x3)2 4 6 2.1. Mecânica do ponto material Uma primeira solução, a mais simples, às equações (8)–(10) é obtida na mecânica do ponto material: (22) P μ = p μ , M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ , com as coordenadas qμ e momentos pμ da partícula sujeitos a: (23) { q μ ; q ν } = 0 , { p μ ; p ν } = 0 , { p μ ; q ν } = g μ ⁢ ν . Desejamos em cada forma dinâmica escrever expressões para esses geradores sobre a superfície inicial (isocrônica). Para isto será necessário incorporar as equações que determinam tal superfície como equações subsidiárias, do tipo: (24) A ≈ 0 . Mas as condições subsidiárias devem permanecer tais frente a qualquer mudança do sistema de coordenadas, o que implica que devam também ser condições subsidiárias: (25) { A ; P ρ } ≈ 0 , { A ; M ρ ⁢ σ } ≈ 0 . Para eliminar as variáveis cujo significado é perdido ao fixar a superfície inicial, usaremos a condição de camada de massa, p2 − m2 = 0, mas a introduziremos nos geradores do grupo de Poincaré usando coeficientes indeterminados (multiplicadores de Lagrange); as equações (22) serão substituídas por: (26) P μ = p μ + λ μ ⁢ ( p 2 - m 2 ) , (27) M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ + λ μ ⁢ ν ⁢ ( p 2 - m 2 ) , com λμν = − λνμ. Tais coeficientes serão determinados pela imposição da equação (25). Forma instantânea. Temos a condição subsidiária: (28) q 0 ≈ 0 . A anulação do seu colchete de Poisson com o gerador Pμ somente acontece se: (29) { q 0 ; P σ } = - δ σ 0 - 2 ⁢ λ σ ⁢ p 0 ≈ 0 , enquanto a equação correspondente às transformações de Lorentz é: (30) { q 0 ; M ρ ⁢ σ } = - q ρ ⁢ δ σ 0 + q σ ⁢ δ ρ 0 - λ ρ ⁢ σ ⁢ 2 ⁢ p 0 ≈ 0 . Das equações (29) e (30) decorrem os valores: (31) λ 0 = - 1 2 ⁢ p 0 , λ r = 0 , λ r ⁢ 0 = - q r 2 ⁢ p 0 , λ r ⁢ s = 0 , r, s = 1, 2, 3. Os geradores na superfície inicial são portanto: (32) P 0 = p 2 + m 2 , P r = p r , (33) M r ⁢ 0 = q r ⁢ p 2 + m 2 , M r ⁢ s = q r ⁢ p s - q s ⁢ p r . Temos usado aqui a notação p2=p12+p22+p32. Forma-ponto. A condição subsidiária nessa forma dinâmica é: (34) q μ ⁢ q μ ≈ κ 2 = constante . Essa constante em geral será não nula; porém, ela pode também ser nula, caso em que o hiperboloide degenera no cone de luz. As condições da equação (25) são assim: (35) { q μ ⁢ q μ ; P ρ } = - 2 ⁢ q ρ - 4 ⁢ λ ρ ⁢ q ⋅ p ≈ 0 , (36) { q μ ⁢ q μ ; M ρ ⁢ σ } = - 4 ⁢ λ μ ⁢ ν ⁢ q ⋅ p ≈ 0 . Dessas equações, obtemos o valor dos coeficientes indeterminados: (37) λ ρ = - q ρ 2 ⁢ q ⋅ p , λ μ ⁢ ν = 0 , e assim também o dos geradores do grupo de Poincaré: (38) P μ = p μ - q μ ⁢ ( p 2 - m 2 ) 2 ⁢ q ⋅ p , (39) M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ . Forma da frente de luz. A condição subsidiária consiste, dessa vez, na especificação do plano nulo inicial: (40) q + ≈ 0 . Agora temos as restrições: (41) { q + ; P ρ } = - δ ρ + - 2 ⁢ λ ρ ⁢ p - ≈ 0 , (42) { q + ; M ρ ⁢ σ } = δ ρ + ⁢ q σ - δ σ + ⁢ q ρ - 2 ⁢ λ ρ ⁢ σ ⁢ p - ≈ 0 . Delas obtemos os multiplicadores –usamos i, j = 1, 2–: (43) λ + = - 1 2 ⁢ p - , λ i = 0 = λ - , λ + - = 0 , λ i + = - q i 2 ⁢ p - , λ i ⁢ j = 0 , λ i - = 0 . E, daqui, os geradores do grupo de Poincaré no plano nulo x+ = 0 são: (44) P + = p ⟂ 2 + m 2 2 ⁢ p - , P - = p - , P i = p i , (45) M i + = q i ⁢ p ⟂ 2 + m 2 2 ⁢ p - - q + ⁢ p i , M + - = q + ⁢ p - , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , M i - = q i ⁢ p - . Nestas expressões: p⟂2=p12+p22. Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler-Stern a condição subsidiária imposta às coordenadas da partícula é: (46) q μ ⁢ q μ + ( q 3 ) 2 ≈ κ 2 = constante . Encontramos as seguintes condições adicionais: (47) { q μ ⁢ q μ + ( q 3 ) 2 ; P ρ } = - 2 ⁢ q ρ - 2 ⁢ q 3 ⁢ δ ρ 3 - 4 ⁢ λ ρ ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) ≈ 0 , (48) { q μ ⁢ q μ + ( q 3 ) 2 ; M ρ ⁢ σ } ⁢ 2 ⁢ q 3 ⁢ ( δ ρ 3 ⁢ q σ - δ σ 3 ⁢ q ρ ) - 4 ⁢ λ μ ⁢ ν ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) ≈ 0 , das quais podemos isolar os coeficientes indeterminados: λ 0,1,2 = - q 0,1,2 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) , λ 3 = 0 , λ 01 = λ 02 = λ 12 = 0 , λ ( 0,1,2 ) ⁢ 3 = - q 0,1,2 ⁢ q 3 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) . As quantidades fundamentais nesta forma dinâmica são portanto: (49) P 0,1,2 = p 0,1,2 - q 0,1,2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) , P 3 = p 3 , M 01 = q 0 ⁢ p 1 - q 1 ⁢ p 0 , M 02 = q 0 ⁢ p 2 - q 2 ⁢ p 0 , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , (50) M ( 0,1,2 ) ⁢ 3 = q 0,1,2 ⁢ p 3 - q 3 ⁢ p 0,1,2 - q 0,1,2 ⁢ q 3 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) . Forma de Leutwyler-Stern 2. Nesta última forma dinâmica a condição subsidiária adota a forma: (51) ( q 0 ) 2 - ( q 3 ) 2 ≈ κ 2 = constante . As condições que tal restrição implica são as que seguem: (52) { ( q 0 ) 2 - ( q 3 ) 2 ; P ρ } = - 2 ⁢ q 0 ⁢ δ ρ 0 + 2 ⁢ q 3 ⁢ δ ρ 3 - 4 ⁢ λ ρ ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) ≈ 0 , (53) { ( q 0 ) 2 - ( q 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ q 0 ⁢ ( δ ρ 0 ⁢ q σ - δ σ 0 ⁢ q ρ ) - 2 ⁢ q 3 ⁢ ( δ ρ 3 ⁢ q σ - δ σ 3 ⁢ q ρ ) - 4 ⁢ λ ρ ⁢ σ ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) ≈ 0 . Desse sistema, obtemos os valores dos multiplicadores de Lagrange: λ 0 = - q 0 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 1, 2 = 0 , λ 3 = q 3 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 0 ⁢ ( 1, 2 ) = q 0 ⁢ q 1, 2 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 03 = 0 , λ 12 = 0 , λ ( 1, 2 ) ⁢ 3 = q 3 ⁢ q 1, 2 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) . Os geradores ficam da seguinte forma: (54) P 0 = p 0 - q 0 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , P 1, 2 = p 1, 2 , P 3 = p 3 + q 3 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , (55) M 0 ⁢ ( 1, 2 ) = q 0 ⁢ p 1, 2 - q 1, 2 ⁢ p 0 + q 0 ⁢ q 1, 2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , M 03 = q 0 ⁢ p 3 - q 3 ⁢ p 0 , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , M ( 1, 2 ) ⁢ 3 = q 1, 2 ⁢ p 3 - q 3 ⁢ p 1, 2 + q 3 ⁢ q 1, 2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) . Como podemos observar, em todas as formas dinâmicas os geradores do grupo de estabilidade da superfície inicial não são modificados pela restrição a ela, mas somente os hamiltonianos o são, em correspondência com a sua ação. Poderemos nos perguntar agora, nesta situação que é ainda a mais simples possível, que é a do ponto material livre, qual é a forma dinâmica que se apresenta mais vantajosa? Olhando para as expressões que acabamos de escrever para os hamiltonianos, é claro que as formas de Leutwyler-Stern não o serão, não já somente pela complexidade de seus hamiltonianos, mas também pelo fato de serem seis deles. A forma instantânea, muito usada, apresenta a dificuldade de uma raíz quadrada; em relação a este ponto, lembre o leitor a impossibilidade de escrever a equação de Klein-Gordon-Fock na forma hamiltoniana na classe dos operadores diferenciais; isto último somente é possível ao ampliar dita classe e considerar os operadores pseudo-diferenciais –o leitor interessado pode consultar a Ref. [50]–. Semelhante dificuldade é evitada na forma-ponto e na forma da frente de luz, que se mostram assim muito convenientes. Já indicamos anteriormente uma vantagem importante da forma-ponto, que é o fato de seus hamiltonianos constituirem um tetra-vetor: A covariância é fácilmente implementada nessa forma dinâmica. No entanto, na expressão de seus hamiltonianos aparece sempre o produto q⋅ p no denominador, o que faz com que eles sejam complicados. Comparativamente, na forma do plano nulo, além de ser aquela em que o número de hamiltonianos é menor, eles têm também uma forma bastante simples; e em adição seu hamiltoniano P+, associado à energia, depende única e exclusivamente dos momentos, a posição não aparece nele, diferentemente da forma-ponto. Convencidos por estes motivos do interesse da forma dinâmica da frente de luz, passaremos a considerar já não a mecânica do ponto, mas os campos clássicos construidos nela. expomos as ideias que levaram Dirac a estabelecer o problema das formas dinâmicas e a solução que a ele foi dado. Essa definição puramente algébrica é levada ao âmbito da teoria do campo clássico na seção 3 3. Forma dinâmica do plano nulo e campos clássicos A discussão que acabamos de fazer a respeito da possibilidade de definir novas formas dinâmicas tem sido baseada na álgebra do grupo de Poincaré e exemplificada na mecânica do ponto material. E para tal, foi suficiente exigir a descrição unívoca de sua linha de mundo. No entanto, na teoria de campos isto não é suficiente, e devemos nos ocupar também da unicidade da descrição da evolução do campo, isto é, do problema de valores iniciais para as diferentes equações do campo. Com efeito: A estrutura causal da teoria da relatividade implica que o valor adotado pelo campo em cada ponto do espaço-tempo depende dos valores que ele tem adotado no cone de luz passado correspondente a tal ponto; donde a inicialização dos valores do campo em uma superfície isocrônica requer conhecer os valores do campo na interseção do referido cone de luz passado e a superfície inicial. Isto é mostrado para as três formas dinâmicas de Dirac na figura 3. Mas logo percebemos uma dificuldade na forma dinâmica do plano nulo: Enquanto que a interseção é uma região finita na forma instantânea e na forma-ponto, ela é uma região infinita na forma do plano nulo. Sendo assim, o problema dos valores iniciais no plano nulo não poderá ser abordado como uma simples transformação do problema de Cauchy, mas precisa ser estudado independentemente. Eis o objetivo da presente seção. Figura 3 Problema dos valores iniciais: (a) Na dinâmica instantânea, (b) na dinâmica forma-ponto, (c) na dinâmica da frente de luz. Na teoria relativística, a invariância sob translações implica que a equação que governa todas as componentes u(x) de todos os campos é a equação de Klein-Gordon-Fock: (56) ( □ + m 2 ) ⁢ u ⁢ ( x ) = 0 . Qualquer relação adicional entre as diferentes componentes de um mesmo campo constitui uma relação de vínculo, mas ela não impede o cumprimento da equação (56) –um caso especial, que pareceria contradizer o dito e que contudo não o faz, é o do campo eletromagnético, que estudaremos na seção 8–. Lembremos ao leitor que a obtenção dessa equação obedece ao fato de que os campos se transformam por representações do grupo de Poincaré, um de cujos operadores de Casimir é o quadrado do operador de momento: P2, então proporcional à identidade (com fator de proporcionalidade que temos denotado por m2), como o assegura o lema de Schur. Determinar quais dados são os que se precisa conhecer para poder antecipar o valor do campo em um ponto futuro é o problema dos valores iniciais, que para equações diferenciais de segunda ordem pode ser precisamente formulado da seguinte forma [51]: Problema dos valores iniciais: Seja (57) ϕ ( u ; x i ; ∂ ⁡ u ∂ ⁡ x i ; ∂ 2 ⁡ u ∂ ⁡ x i 2 ; ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k ) = 0 ( i = 1 , ⋯ , m ) uma equação diferencial parcial de segunda ordem, linear em u e suas derivadas com coeficientes que são funções quaisquer das variáveis xi. O problema dos valores iniciais com respeito à «superfície inicial» xm = 0 consiste em encontrar uma solução sujeita aos «dados iniciais»: (58) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) , ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . □ É claro, toda equação diferencial, quer ordinária, quer parcial, admite um número infinito de soluções, que são escritas como uma «integral geral» contendo um determinado número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em seu enunciado um conjunto de condições adicionais –os dados iniciais– que visam determinar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possível com elas determinar uma e só uma solução, pois pode acontecer que os dados iniciais sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os elementos arbitrários. Assim, diremos que o problema dos valores iniciais está bem definido se ele (i) tem solução, e (ii) dita solução é única. 3.1. Problema de Cauchy-Kovalevskaya O caso mais famoso do problema dos valores iniciais é o «problema de Cauchy», que se caracteriza porque na equação diferencial a segunda derivada de u em relação à variável xm que define a superfície inicial xm = 0 possui um coeficiente não nulo. As condições sob as quais o problema de Cauchy está bem definido são estabelecidas no seguinte teorema, que apresentaremos para o caso de duas variáveis independentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–: Teorema de Cauchy-Kovalevskaya: Seja o problema de valores iniciais para a equação diferencial parcial de segunda ordem e duas variáveis (59) ϕ ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ x 2 ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) = 0 . Se acontece que (60) ∂ ⁡ ϕ ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x 2 ) ≠ 0 , de tal forma que podemos escrever a equação (59) na forma: (61) ∂ 2 ⁡ u ∂ ⁡ x 2 = f ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) , com f uma função holomórfica –isto é, analítica e regular– na vizinhança de x = 0, então o problema de Cauchy está bem definido para qualquer valor funcional dos dados de Cauchy: (62) u ⁢ ( 0 ; y ) = u 0 ⁢ ( y ) e ∂ ⁡ u ∂ ⁡ x ⁢ ( 0 ; y ) = u 1 ⁢ ( y ) . □ O leitor interessado nos detalhes técnicos desse teorema pode consultar as Refs. [51, 52]. O que aqui exporemos é a construção da solução, que tem como consequência direta a sua unicidade. Escrevamos a função incógnita u(x; y) como série de potências na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy: (63) u = u 0 + u 1 ⁢ x + ⋯ + u h h ! ⁢ x h + ⋯ ; u h = u h ⁢ ( y ) ≡ ∂ h ⁡ u ∂ ⁡ x h | x = 0 . Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1, portanto, devemos nos preocupar em encontrar uh para h ≥ 2 em função deles. Notando que, em geral: (64) ∂ h + k ⁡ u ∂ ⁡ x h ⁢ ∂ ⁡ y k | x = 0 = ∂ k ⁡ u h ∂ ⁡ y k , podemos obter a solução desejada com o seguinte conjunto de passos: Tomando x = 0 na equação (61) obtemos: (65) u 2 = f ⁢ ( u 0 ; 0 ; y ; u 1 ; ∂ ⁡ u 0 ∂ ⁡ y ; ∂ 2 ⁡ u 0 ∂ ⁡ y 2 ; ∂ ⁡ u 1 ∂ ⁡ y ) , o que significa que u2 está determinado pelo conhecimento de u0 e u1. O fato de aparecer também suas derivadas na equação (65) não é motivo de preocupação, pois elas estão tomadas em relação à variável y com x = 0, e, portanto, podem se obter dos dados de Cauchy. Derivemos agora a equação (61) em relação a x, então coloquemos x = 0; obteremos: (66) u 3 = ⁢ ∂ ⁡ f ∂ ⁡ u ⁢ u 1 + ∂ ⁡ f ∂ ⁡ x + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ x ) ⁢ u 2 + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ y ) ⁢ ∂ ⁡ u 1 ∂ ⁡ y + ⋯ + ∂ ⁡ f ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x ⁢ ∂ ⁡ y ) ⁢ ∂ ⁡ u 2 ∂ ⁡ y , todas essas derivadas tomadas nos argumentos de f na equação (65). Assim, a equação (66) diz que a função u3 está determinada pelos dados de Cauchy e a função u2 obtida com eles. Note também que a condição de f ser holomórfica na vizinhança de x = 0 tem sido usada para tomar sua derivada nesse ponto. Isto ocorre também nos seguintes termos na seqüência da equação (63), que são obtidos por derivação sucessiva da equação (61) em x = 0: o resultado será sempre que a função uh é um polinômio de u0, u1, …, uh − 1 e suas derivadas, assim como de f e suas derivadas tomadas nos argumentos da equação (65). Uma vez que conhecemos as funções uh, podemos expressá-las como séries de potências na variável y ao redor do valor y0 fixo: (67) u h ⁢ ( y ) = ∑ k u h ⁢ k k ! ⁢ ( y - y 0 ) k , e, então, a solução completa do problema de Cauchy é: (68) u ⁢ ( x ; y ) = ∑ h , k u h ⁢ k h ! ⁢ k ! ⁢ x h ⁢ ( y - y 0 ) k , com todos os coeficientes uhk determinados pelos dados de Cauchy. Como os coeficientes são únicos, podemos estabelecer: O problema de Cauchy não admite mais de uma solução holomórfica, representada pela série da equação (68). Essa é a unicidade da solução. Sua existência depende do fato da série da equação (68) ser convergente para |x| e |y − y0| limitados por certos valores apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial de segunda ordem possui problema de Cauchy bem definido se especificarmos a função e sua primeira derivada em relação a uma de suas variáveis numa superfície em que dita variável adota um valor fixo, e que, ademais, se a solução existe, então ela é única. Problema de Cauchy-Kovalevskaya para a equação de Klein-Gordon-Fock. Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [equação (56)]. Como estamos interessados na evolução temporal da solução, escolheremos a variável t para enunciar o problema de Cauchy –notando que essa escolha determina já o uso da dinâmica instantânea–: Seja u(x) = u(t; x) uma função que satisfaz à equação de segunda ordem: (69) ∂ 2 ⁡ u ∂ ⁡ t 2 ⁢ ( x ) = ( ∇ 2 - m 2 ) ⁢ u ⁢ ( x ) , sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0: (70) u ⁢ ( 0 ; x ) = u 0 ⁢ ( x ) e ∂ t ⁡ u ⁢ ( 0 ; x ) = u 1 ⁢ ( x ) . Logo, vemos que a equação (69) tem a forma da equação (61) e, portanto, a tese do teorema de Cauchy-Kovalevskaya é aplicável. Para solucionar tal equação passamos ao espaço dos momentos por meio da transformação de Fourier aplicada à função u. Substituíndo-a na equação (69) vemos que ela tem de ter a forma: (71) u ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p | 2 ⁢ p 0 | ⁢ [ δ ⁢ ( p 0 - ω p ) + δ ⁢ ( p 0 + ω p ) ] (72) × u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x , com: ωp≡p2+m2 –pode-se reconhecer aqui a forma do gerador P0 da equação (32)–. Integrando na variável p0 com o uso das distribuições delta de Dirac, obtemos a separação em partes de freqüência positiva e freqüência negativa: (73) u ( x ) = ( 2 π ) - 2 ∫ d 3 ⁢ p 2 ⁢ ω p [ u + ( p ) e - i ⁢ p ⁢ x | p 0 = ω p + u - ( p ) e - i ⁢ p ⁢ x | p 0 = - ω p ] . Coloquemos aqui os dados de Cauchy da equação (70). Primeiramente, como u0(x) = u(0; x): (74) u 0 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ [ u + ⁢ ( p ) + u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x . Mas podemos escrever: (75) u 0 ⁢ ( x ) = ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ δ ⁢ ( x - y ) = ( 2 ⁢ π ) - 3 ⁢ ∫ d 3 ⁢ p ⁢ ( ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y ) ⁢ e i ⁢ p ⋅ x , a partir do qual obtemos, via uma comparação das equações (74) e (75) e a independência linear das funções exponenciais eip⋅ x, que: (76) u + ⁢ ( p ) + u - ⁢ ( p ) = 2 ⁢ ω p ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . Usaremos agora os dados de Cauchy referidos à derivada de u. Como u1(x) = ∂tu(0; x): (77) u 1 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ ( - i ⁢ ω p ) ⁢ [ u + ⁢ ( p ) - u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x , e, novamente reescrevendo o lado esquerdo com ajuda da distribuição delta de Dirac tridimensional e comparando com a equação (77), encontramos que: (78) u + ⁢ ( p ) - u - ⁢ ( p ) = 2 ⁢ i ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 1 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . As equações (76) e (78) nos permitem encontrar explicitamente as funções u±(p) em dependência com os dados de Cauchy u0 e u1: (79) u ± ⁢ ( p ) = ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ [ ω p ⁢ u 0 ⁢ ( y ) ± i ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⋅ y . Substituíndo-as na equação (73) e completando p⋅ y = py|y0 = 0, o que serve para escrever a integração com medida d3y explícitamente na superfície y0 = 0 em que são fornecidos os dados de Cauchy: (80) u ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ ∫ y 0 = 0 d 3 ⁢ y × [ ω p ⁢ u 0 ⁢ ( y ) + i ⁢ sgn ⁢ ( p 0 ) ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⁢ ( x - y ) . É possível escrever: (81) ω p ⁢ e - i ⁢ p ⁢ ( x - y ) = i ⁢ sgn ⁢ ( p 0 ) ⁢ ∂ 0 x ⁡ e - i ⁢ p ⁢ ( x - y ) , e assim: (82) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 x ⁡ D ⁢ ( x - y ) + D ⁢ ( x - y ) ⁢ u 1 ⁢ ( y ) ] , com a definição da «distribuição de Jordan-Pauli»: (83) D ⁢ ( x ) := i ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ sgn ⁢ ( p 0 ) ⁢ e - i ⁢ p ⁢ x . Esta distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac que aparece em seu integrando, ela satisfaz a equação de Klein-Gordon-Fock com massa m, isto é, a mesma equação diferencial do campo u: (84) ( □ + m 2 ) ⁢ D ⁢ ( x ) = 0 . Também, de sua forma explícita dada na equação (83): (85) D ⁢ ( x ) = - D ⁢ ( - x ) . Fazendo uso, precisamente, desta última propriedade, podemos escrever a equação (82) com a derivada que age sobre D(x − y) não sendo já na variável x0, mas na variável y0: (86) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 y ⁡ D ⁢ ( y - x ) - D ⁢ ( y - x ) ⁢ u 1 ⁢ ( y ) ] . Essa mudança é útil porque, lembremos: u1⁢(y)=∂0y⁡u⁢(0;y); mas o fato de ser y0 = 0 já está indicado na integral e, então, podemos escrever simplesmente, dentro dela, u1⁢(y)=∂0y⁡u⁢(y) e u0(y) = u(y). Assim: (87) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ u ⁢ ( y ) ⁢ ∂ ↔ 0 y ⁢ D ⁢ ( y - x ) . Aqui, o símbolo f⁢∂↔⁢g significa f∂ g − ∂ fg. Usando mais uma vez a equação (85), a equação (87) é igual a: (88) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície y0 = 0, que, existindo, é única, como demonstrado na construção anterior. A causalidade da qual falávamos se evidencia na expressão –os detalhes do cálculo são mostrados, por exemplo, na Ref. [53]–: (89) D ⁢ ( x ) = 1 2 ⁢ π ⁢ sgn ⁢ ( x 0 ) ⁢ [ δ ⁢ ( x ) - Θ ⁢ ( x 2 ) ⁢ m 2 ⁢ x 2 ⁢ J 1 ⁢ ( m ⁢ x 2 ) ] , o que implica que: (90) supp ⁢ ( D ⁢ ( x ) ) = V + ⁢ ( 0 ) ∪ V - ⁢ ( 0 ) , com: (91) V + ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≥ x 0 } o «cone de luz futuro em relação ao ponto x», e (92) V - ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≤ x 0 } o «cone de luz passado em relação ao ponto x». Para terminar de introduzir a nomenclatura, digamos que a união V+(x)∪ V−(x) é o «cone de luz com vértice no ponto x». Isto é, D(x) tem suporte causal em relação à origem do sistema de coordenadas. Vejamos o que isto quer dizer à luz da equação (87): Da equação (90) temos que, transladando a origem até o ponto x em que queremos conhecer o valor do campo u, D(y − x) tem suporte no cone de luz com vértice em x, isto é, u(x) não é afetado pelos valores que no passado o campo tomou fora do cone de luz de x, nem afetará os valores que o campo tomará fora do cone de luz de x no futuro. 3.2. Problema de Goursat Consideremos agora que: nossa solução, embora satisfatória, não é tão geral como gostaríamos, pois precisa do conhecimento dos dados iniciais numa superfície de tempo constante, o que obriga a escolha da forma dinâmica instantânea. Mas, o que aconteceria se os dados fossem conhecidos numa superfície diferente? Voltemos ao problema de valores iniciais como enunciado na equação (57), e suponhamos que o espaço m-dimensional seja submetido à transformação de coordenadas: (93) X 1 = G 1 ⁢ ( x 1 ; ⋯ ; x m ) , ⋯ , X m = G m ⁢ ( x 1 ; ⋯ ; x m ) , de tal forma que Xm = Gm(x1;⋯; xm) = 0 seja a superfície em que são conhecidos os dados iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas, com u(x1;⋯; xm) = U(G1(x1;⋯; xm);⋯; Gm(x1;⋯; xm)): (94) Φ ⁢ ( U ; X i ; ∂ ⁡ U ∂ ⁡ X i ; ∂ 2 ⁡ U ∂ ⁡ X i 2 ; ∂ 2 ⁡ U ∂ ⁡ X i ⁢ ∂ ⁡ X k ) = 0 . Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações na teoria, pois parece que podemos simplesmente aplicar o teorema de Cauchy-Kovalevskaya à nova equação diferencial. Porém, suponhamos que a equação (59) seja linear, e que tem portanto a seguinte forma geral: (95) ∑ i , k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + C ⁢ u = f , com Aik = Aki, Bi, C e f funções das variáveis xi. Suponhamos agora que as transformações da equação (93) sejam feitas. Então usando a regra da cadeia obtemos que a equação (95) é, em relação às variáveis Xi: (96) ∑ j , l ( ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G j ∂ ⁡ x i ⁢ ∂ ⁡ G l ∂ ⁡ x k ) ⁢ ∂ 2 ⁡ U ∂ ⁡ X j ⁢ ∂ ⁡ X l + ∑ l ( ∑ i B i ⁢ ∂ ⁡ G l ∂ ⁡ x i ) ⁢ ∂ ⁡ U ∂ ⁡ X l + C ⁢ U = f . Como temos observado, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumprimento da equação (60), isto é, ele será aplicável só se ∂2⁡U/∂⁡Xm2 aparece na equação (96). Isto coloca em primeiro plano a «forma característica» 𝔸 definida como5: (97) 𝔸 ⁢ ( γ 1 ; ⋯ ; γ m ) := ∑ i , k γ i ⁢ A i ⁢ k ⁢ γ k . Da equação (96) vemos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz se: (98) ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G m ∂ ⁡ x i ⁢ ∂ ⁡ G m ∂ ⁡ x k = 0 . Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode ser realizada trivialmente. As superfícies Gm(x1;⋯; xm) = 0 para as quais isto acontece recebem o nome de «superfícies características» da equação diferencial. O problema dos valores iniciais em que a superfície inicial é uma superfície característica é conhecido como «problema de Goursat» [54], e o desenvolveremos a seguir. Seja a seguinte equação diferencial em que a segunda derivada em relação à variável xm não pode ser isolada, pois não aparece; ou seja, a equação diferencial escrita em termos de coordenadas tais que a superfície xm = 0 é uma superfície característica (Amm = 0): (99) ∑ i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i = 1 m - 1 A i ⁢ i ⁢ ∂ 2 ⁡ u ∂ ⁡ x i 2 + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + c ⁢ u = f . Nosso primeiro propósito será ver se os dados iniciais que são suficientes no problema fora de superfícies características são também suficientes nesse caso. Suponhamos, pois, que sejam conhecidos: (100) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) ; ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . Façamos, como anteriormente, a expansão ao redor de xm = 0: (101) u = u 0 + u 1 ⁢ x m + ⋯ + u h h ! ⁢ x m h + ⋯ ; u h = u h ⁢ ( x 1 ; ⋯ ; x m ) ≡ ∂ h ⁡ u ∂ ⁡ x m h | x m = 0 . Colocando essa expansão na equação (99), então avaliando em xm = 0, obtemos já não uma expressão para u2 como outrora obtivemos, mas uma equação diferencial para u1: (102) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u 1 ∂ ⁡ x i + B m ⁢ u 1 + H 1 = 0 , com H1 dependendo somente de u0 e suas derivadas: (103) H 1 = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u 0 ∂ ⁡ x i + C ⁢ u 0 - f . Vemos, pois, que se u1 não for dado de forma a satisfazer essa equação diferencial, então o problema de valores iniciais com os dados iniciais da equação (100) não tem solução. Portanto, precisamos fornecer outros dados iniciais, a saber, os necessários para que as equações diferenciais que se obtêm para as funções uh possam ser univocamente solucionadas. A equação (102) é uma equação diferencial parcial de primeira ordem para u1. Vejamos se também as equações para os outros uh são desse tipo. Derivando a equação (99) h − 1 vezes em relação a xm e então tomando xm = 0, obtemos a equação diferencial para uh: (104) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u h ∂ ⁡ x i + B m ⁢ u h + H h = 0 , com: (105) H h = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u h - 1 ∂ ⁡ x i + C ⁢ u h - 1 - ∂ h - 1 ⁡ f ∂ ⁡ x m h - 1 . Observamos que todas as equações diferenciais que se obtêm para as funções uh são de primeira ordem. Para solucioná-las, estudemos o método das características para esse tipo de equações. Para simplificar a exposição, além disso, consideremos o caso de duas variáveis e suponhamos que queremos resolver a equação: (106) A ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ x + B ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ y - C ⁢ ( x ; y ; u ) = 0 . As equações (104) são todas desse tipo, com a particularidade de ser A(x; y) = 0, o que colocaremos no final. Solucionar a equação (106) significa determinar uma solução u = z(x; y); essa superfície solução tem vetor normal n = (∂ z/∂ x;∂ z/∂ y; − 1); portanto, definindo o campo vetorial F = (A; B; C), a equação (106) pode ser escrita como: (107) F ⋅ n = 0 . Ou seja, F é tangente à superfície solução u = z(x; y), tendo como consequência que esta é constituída por curvas integrais daquela; tais curvas integrais são chamadas «curvas características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os valores de u(x; y) numa curva γ no plano x − y, cujo uso permite estabelecer a curva Γ sobre a superfície z(x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser gerada uma curva integral de F, construindo assim a superfície z(x; y). Levando a ideia à prática, podemos parametrizar, para a em algum domínio de variação: (108) Γ ( a ) = ( x = x 0 ( a ) ; y = y 0 ( a ) ; z = z 0 ( a ) ) . Determinar para cada valor de a uma curva integral de F que passe por Γ(a) significa resolver, para cada valor de a, o «sistema de equações diferenciais de Lagrange-Charpit»: Para um parâmetro s: (109) d ⁢ x d ⁢ s = A ⁢ ( x ; y ) ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) , (110) d ⁢ y d ⁢ s = B ⁢ ( x ; y ) ; y ⁢ ( 0 ) = y 0 ⁢ ( a ) , (111) d ⁢ z d ⁢ s = C ⁢ ( x ; y ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) . As soluções desse sistema, (112) x = X ⁢ ( a ; s ) , y = Y ⁢ ( a ; s ) , z = Z ⁢ ( a ; s ) , são já uma representação paramétrica da superfície solução. Para obtê-la na forma u = z(x; y), precisaremos inverter: (113) a = Λ ⁢ ( x ; y ) e s = S ⁢ ( x ; y ) , com o qual a solução buscada será: (114) u ⁢ ( x ; y ) = Z ⁢ ( Λ ⁢ ( x ; y ) ; S ⁢ ( x ; y ) ) . Vale ressaltar que para que possa ser gerada a superfície solução a partir da curva Γ por ação do campo vetorial F, é preciso que Γ não seja já uma curva característica –uma curva integral de F–, pois então ela seria invariante pela ação de F. Vejamos como isto funciona em nosso caso: As equações (104) dão lugar às equações de Lagrange-Charpit com o lado direito da equação (109) nulo: (115) d ⁢ x d ⁢ s = 0 ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) . Isto é, x é independente do parâmetro s. Se os dados iniciais fossem dados numa linha de x = constante, então x seria também independente de a; logo não poderíamos obter a solução do sistema mais que para um valor constante de x. Concluimos: Os dados iniciais que são precisos para solucionar univocamente as equações (104) não podem ser dados na superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, se os dados iniciais estão na linha de y constante: (116) Γ = ( x = x 0 ( a ) ; y = y 0 ; z = z 0 ( a ) ) , com y0 independente de a. A equação (115) tem solução: x = x0(a). Substituíndo na equação (110), como x é independente de s, a integração se torna elementar: (117) s = ∫ y 0 y d ⁢ y B ⁢ ( x 0 ⁢ ( a ) ; y ) . Finalmente, a equação (111) será: (118) d ⁢ z d ⁢ s = C ⁢ ( x 0 ⁢ ( a ) ; y ⁢ ( a ; s ) ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) , que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução única. A análise recém realizada demonstra que as equações (104) que determinam as funções uh poderão ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por exemplo, com xk = constante, k ≠ m. Conclui-se que, quando o problema de valores iniciais está definido sobre uma superfície característica da equação diferencial, os dados iniciais não podem ser o valor da função e sua primeira derivada normal à superfície característica, pois em tal caso o problema pode não ter solução ou ter infinitas soluções. Em seu lugar, devem ser dados: o valor da função na superfície característica e o valor da função em uma superfície diferente dela. 3.3. Superfícies características da equação de Klein-Gordon-Fock Uma vez que temos visto que o problema de valores iniciais pode ser bem definido sobre superfícies características, apliquemos o conhecimento adquirido para a equação de Klein-Gordon-Fock com que iniciamos essa discusão [equação (56)]: (119) ∂ 2 ⁡ u ∂ ⁡ t 2 - ∂ 2 ⁡ u ∂ ⁡ x 2 - ∂ 2 ⁡ u ∂ ⁡ y 2 - ∂ 2 ⁡ u ∂ ⁡ z 2 + m 2 ⁢ u = 0 . Comparando com a equação (95), reconhecemos que para essa equação são6: (120) A μ ⁢ ν = η ~ μ ⁢ ν , B μ = 0 , C = m 2 e f = 0 . Aqui, η~μ⁢ν são as componentes do tensor métrico do espaço-tempo de Minkowski: (η~μ⁢ν)=diag⁢(+1;-1;-1;-1). A forma característica [vide a equação (97)] é aqui η~μ⁢ν⁢γμ⁢γν, que se anula para γμ um vetor tipo-luz: (121) ( γ 0 ) 2 = γ 2 . Assim sendo, a transformação de coordenadas Xμ = Gμ(t; x; y; z) será tal que X0 = constante é uma superfície característica se [vide a equação (98)] a função G0 satisfaz à equação diferencial: (122) ( ∂ ⁡ G 0 ∂ ⁡ t ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ x ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ y ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ z ) 2 = 0 , cuja solução é: (123) G 0 = a ⁢ t + b ⁢ x + c ⁢ y + d ⁢ z ; a = ± b 2 + c 2 + d 2 . Isto é, as superfícies características da equação de Klein-Gordon-Fock são as superfícies X0 = 0, com: (124) X 0 ∼ t ± b ⁢ x + c ⁢ y + d ⁢ z b 2 + c 2 + d 2 , ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade com a coordenada X0, podendo ser arbitráriamente escolhidas. Façamos uma escolha: Definição: Sejam (x0; x1; x2; x3) coordenadas cartesianas no espaço-tempo de Minkowski tais que o tensor métrico adota sua forma diagonal normalizada η~μ⁢ν. O conjunto de coordenadas (x+; x1; x2; x-), com: (125) x + := 1 2 ⁢ ( x 0 + x 3 ) , x - := 1 2 ⁢ ( x 0 - x 3 ) , é chamado conjunto de coordenadas do plano nulo. □ A eleição da superfície característica em que os dados iniciais sejam dados, quer x+ = 0, quer x− = 0, é um assunto puramente convencional, mas importante por ser, implícitamente, uma eleição do parâmetro de evolução dos campos, que doravante chamaremos «tempo». Escolhemos x+ como coordenada temporal; a seguinte nomenclatura é usada: x− é a coordenada «longitudinal», e x⊥ = (x1; x2) são as coordenadas «transversais». As coordenadas cartesianas (x0; x1; x2; x3) passarão a ser chamadas «coordenadas instantâneas», por razões óbvias. O fator de proporcionalidade escolhido na definição de x± na equação (125) tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é igual à unidade, de forma que o elemento de volume não muda: (126) d 4 ⁢ x = d ⁢ x + ⁢ d ⁢ x - ⁢ d 2 ⁢ x ⊥ . Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte representação matricial: (127) [ η a ⁢ b ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) = [ η a ⁢ b ] . Pelo proferido, concluímos que o problema de Goursat da equação de Klein-Gordon-Fock é o problema dos valores iniciais na dinâmica da frente de luz. E mais ainda: Essa é a única exceção à aplicabilidade do teorema de Cauchy-Kovalevskaya: É a única forma dinâmica na qual o problema dos valores iniciais não pode ser obtido por deformação da superfície inicial em alguma outra forma dinâmica. Passemos a estabelecer a solução do problema de Goursat da equação de Klein-Gordon-Fock. Para isso, lembremos da equação (88): Em coordenadas instantâneas: (128) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Denotemos a versão tetra-vetorial do integrando por Nμ(x; y): (129) N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) . Tomando a divergência em relação à variável y, vemos que: (130) ∂ μ y ⁡ N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ □ y ⁢ u ⁢ ( y ) - □ y ⁢ D ⁢ ( x - y ) ⁢ u ⁢ ( y ) = 0 , pois tanto u como D satisfazem à equação de Klein-Gordon-Fock de massa m [vide a equação (84)]. Portanto, sendo de divergência nula, podemos usar o teorema de Gauss no volume Ω limitado pelo sólido A − B − C − D na Fig. 4 –compare-se essa figura com a 3–, em que o ponto P, vértice do cone de luz, representa o ponto x em que desejamos conhecer o valor do campo u. Então teremos que: Figura 4 Volume de integração para a obtenção da solução do problema de Goursat da equação de Klein-Gordon-Fock. (131) 0 = ∫ Ω d 4 ⁢ y ⁢ ∂ μ y ⁡ N μ ⁢ ( x ; y ) = ∫ ∂ ⁡ Ω d σ μ ⁢ ( y ) ⁢ N μ ⁢ ( x ; y ) = ( ∫ A - B + ∫ B - C + ∫ C - D + ∫ D - A ) × D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) ⁢ d ⁢ σ μ ⁢ ( y ) . Porém, B − C está fora do cone de luz do ponto P, e a integral nessa superfície se anula, pois D(x − y) tem suporte causal. Assim sendo, identificando a integral sobre A − B como a solução da equação (128) e reconhecendo que os vetores normais às superfícies C − D e D − A são, respectivamente, nas coordenadas do plano nulo, (0;0;0; − 1) e (− 1; 0; 0; 0), obteremos que: (132) u ⁢ ( x ) = ∫ D - A D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - + ∫ C - D D ⁢ ( x - y ) ⁢ ∂ ↔ + y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y + , visto que a superfície D − A é de x+ = constante e a C − D é de x− = constante. Isto é concordante com nossos estudos prévios: A solução ao problema de valores iniciais é única e bem definida se os dados iniciais são o valor do campo na superfície característica e o valor dele em uma superfície diferente da anterior. Em outras palavras, temos substituído o valor de u e ∂0u em um plano tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular, podemos fazer o limite em que a superfície C − D se encontra em x− → − ∞, e os dados iniciais nessa superfície são substituídos pela «condição assintótica» [14, 15]: (133) lim x - → - ∞ ⁡ u ⁢ ( x ) = 0 . Em tal caso, a solução da equação (132) se simplifica a: (134) u ⁢ ( x ) = ∫ y + = y 0 + D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - , que precisa do conhecimento só do valor do campo na superfície isocrônica x+=x0+. . Os elementos básicos para a descrição do plano nulo são apresentados na seção 4 4. Coordenadas invariantes do plano nulo Como temos estabelecido, a relação entre uma forma dinâmica e outra vai além de uma simples transformação de coordenadas7: A verdadeira diferença fundamental é que com essa mudança temos um novo conjunto de dados iniciais, que evoluem causalmente de uma superfície para outra segundo os geradores dinâmicos da forma particular. Assim, é possível usar, em qualquer forma dinâmica, qualquer conjunto de coordenadas. Por exemplo, é perfeitamente possível usar coordenadas no plano nulo e ainda assim estar na dinâmica instantânea, se os dados iniciais fossem dados numa superfície de x0 constante. Isto porque, já vimos na seção 2, uma transformação das coordenadas não implica uma transformação da superfície inicial. Por isso, para recuperar a covariância da teoria e assim explicitar que o sistema de coordenadas nada tem a ver com a forma dinâmica, Rohrlich [14, 15] introduziu um conjunto de campos vetoriais, tais que seja sempre possível levar as quantidades covariantes à forma «própria» do plano nulo. Consideremos um sistema inercial de referência; ele define sua origem O e seus eixos cartesianos instantâneos segundo a escolha de quatro campos vetoriais e~(0), e~(1), e~(2) e e~(3), tais que as coordenadas cartesianas instantâneas de um ponto P qualquer são obtidas por projeção8: (135) x ( a ) ( P ) = : ∫ O P e ~ d μ ( a ) x μ ; ( a ) = ( 0 ) , ( 1 ) , ( 2 ) , ( 3 ) , expressão esta que é invariante frente a qualquer substituição das coordenadas. Portanto, uma transformação de coordenadas muda xμ, e, claro, as componentes e~μ(a), mas o campo vetorial e~(a), assim como as coordenadas x(a), se mantêm as mesmas. Uma transformação de sistema de referência muda os campos vetoriais e~(a) e, em consequência, as coordenadas x(a). Os campos e~(a) são chamados «campos de tétradas», e as coordenadas x(a), «coordenadas invariantes». Mais em geral, também outras grandezas podem ser projetadas com o campo de tétradas para obter sua forma invariante. Em particular, a métrica gμν se relaciona com a métrica invariante η~(a)⁢(b) por: (136) g μ ⁢ ν ( x ) e ~ ( x ) ( a ) μ e ~ ( x ) ( b ) ν = η ~ ( a ) ⁢ ( b ) , ou, inversamente: (137) η ~ ( a ) ⁢ ( b ) ( x ) e ~ ( x ) μ ( a ) e ~ ( x ) ν ( b ) = g μ ⁢ ν . Agora, como já mencionado (vide a Ref. [55]): « […] a eleição da base de tétradas depende das simetrias subjacentes do espaço-tempo e é, em boa medida, parte do problema» . É claro, quando o autor se refere às «simetrias do espaço-tempo», devemos entender que entre elas estão também as simetrias do problema a se resolver. E como temos insistido em que alguns problemas se simplificam com o uso da forma dinâmica do plano nulo, algumas vezes será vantajoso escolher a base de tétradas obtida, exigindo que a métrica invariante dessa dinâmica seja igual à métrica nesse conjunto de coordenadas [vide a equação (127)]: (138) [ η ( a ) ⁢ ( b ) ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) . Porém, as componentes do tensor métrico gμν dependem unicamente do sistema de coordenadas, e não da base de tétradas, de forma que, se denotarmos por e(+), e(1), e(2) e e(− ) os campos de tétradas correspondentes ao plano nulo, então: (139) e ~ e ~ μ ( 0 ) - ν ( 0 ) e ~ e ~ μ ( 1 ) - ν ( 1 ) e ~ e ~ μ ( 2 ) - ν ( 2 ) e ~ e ~ μ ( 3 ) = ν ( 3 ) g μ ⁢ ν = e e μ ( + ) + ν ( - ) e e μ ( - ) - ν ( + ) e e μ ( 1 ) - ν ( 1 ) e e μ ( 2 ) , ν ( 2 ) e uma solução é9: (140) e ( + ) = 1 2 ⁢ ( e ~ ( 0 ) + e ~ ( 3 ) ) , e ( - ) = 1 2 ⁢ ( e ~ ( 0 ) - e ~ ( 3 ) ) , e ( 1 ) = e ~ ( 1 ) , e ( 2 ) = e ~ ( 2 ) . E, correspondentemente: (141) e ( + ) = 1 2 ⁢ ( e ~ ( 0 ) + e ~ ( 3 ) ) , e ( - ) = 1 2 ⁢ ( e ~ ( 0 ) - e ~ ( 3 ) ) , e ( 1 ) = e ~ ( 1 ) , e ( 2 ) = e ~ ( 2 ) . Os campos de tétradas da dinâmica da frente de luz, por sua definição, apresentam as seguintes propriedades –usaremos doravante α, β = 1, 2–: (142) e ( + ) ⋅ e ( + ) = 0 = e ( - ) ⋅ e ( - ) , e ( + ) ⋅ e ( - ) = 1 , e ( α ) ⋅ e ( β ) = - δ α ⁢ β , e ( + ) ⋅ e ( α ) = 0 = e ( - ) ⋅ e ( α ) . Particularmente, é fácil verificar que quando as tétradas assumem seus valores canônicos, isto é, com componentes e(+) = (1;0;0;0), e(1) = (0;1;0;0), e(2) = (0;0;1;0) e e(− ) = (0;0;0;1), então, a métrica gμν se iguala com a métrica invariante: [gμν] = [η(a)(b)] dada na equação (138), o que significa que as coordenadas invariantes coincidem com as coordenadas no plano nulo, como deve ser por consistência. Sendo o conjunto {e(a)} (a = + ,1, 2, − ) uma base do espaço-tempo de Minkowski, podemos decompor qualquer vetor A como combinação linear de seus elementos. Escrevemos: A=∑(a)A(a)⁢e(a). Multiplicando por um elemento da base dual –base de co-tétradas– e(b): e ( b ) ⋅ A = ∑ ( a ) A ( a ) e ( b ) ⋅ e ( a ) = ∑ ( a ) A ( a ) δ = ( a ) ( b ) A ( b ) . Portanto, o vetor A tem componentes invariantes: (143) A ( + ) := A ⋅ e ( + ) , A ( α ) := A ⋅ e ( α ) , A ( - ) := A ⋅ e ( - ) , e decomposição na base de tétradas: (144) A = A ( + ) ⁢ e ( + ) + A ( ⊥ ) ⁢ e ( ⊥ ) + A ( - ) ⁢ e ( - ) , com: A(⊥)⁢e(⊥)≡∑α=12A(α)⁢e(α). O produto escalar de dois vetores A e B pode ser escrito agora em função de suas componentes invariantes no plano nulo: (145) A ⋅ B = A ( + ) ⁢ B ( - ) + A ( - ) ⁢ B ( + ) - A ( ⊥ ) ⁢ B ( ⊥ ) . Em particular, o vetor posição10 x tem decomposição: x = x(+)e(+) + x(− )e(− ) + x(⊥)e(⊥), e também o operador derivada: ∂ = e(+)∂(−) + e(− )∂(+) − e(⊥)∂(⊥), cujas componentes invariantes são dadas pela definição de derivadas direcionais: (146) ∂ ( + ) = e ( + ) ⋅ ∂ = ∂ ∂ ⁡ ( e ( - ) ⋅ x ) = ∂ ∂ ⁡ x ( + ) , e analogamente: (147) ∂ ( - ) = e ( - ) ⋅ ∂ = ∂ ∂ ⁡ x ( - ) , ∂ ( ⊥ ) = e ( ⊥ ) ⋅ ∂ = ∂ ∂ ⁡ x ( ⊥ ) . Finalmente, como escolhemos a coordenada x(+) como o tempo na dinâmica da frente de luz, o vetor e(+) indicará a direção temporal nessa dinâmica, e ∂(+) será a derivada temporal. Cada plano nulo de x(+) = constante é gerado pelos três vetores e(⊥) e e(− ), e tem elemento de volume que denotaremos por d3⁢x¯:=d⁢x(1)⁢d⁢x(2)⁢d⁢x(-)≡d2⁢x(⊥)⁢d⁢x(-). . Na seção 5 5. Formalismo lagrangiano e o primeiro teorema de Nöther Uma vez estabelecidos todos os elementos necessários para estudar a física no plano nulo, fixaremos a consideração na teoria de campos clássicos, ou seja, à descrição ondulatória da partícula individual por suas equações de movimento, sem sujeitar ainda suas soluções aos axiomas da teoria quântica –isto é, desconsiderando as exigências da interpretação probabilística, a possibilidade de mudança do número e identidade das partículas, et cetera –. Uma abordagem, quiçá a mais habitual para o estudo dos campos, é a abordagem lagrangiana. Como ela é bem conhecida e, por outra parte, existem excelentes referências para seu estudo –vide o leitor, por exemplo, as Refs. [53, 59, 60, 61]–, nos limitaremos aqui apenas a oferecer um brevíssimo resumo com o intuito de fixar a notação. Seja uA(x) (A = 1,⋯, N) a componente A-ésima de um conjunto de N, definidas no espaço-tempo tetra-dimensional de Minkowski, 𝕄. Tais componentes são genéricas, isto é, podem pertencer a campos de diferente natureza. A integral de ação extendida à região espaço-temporal Ω, é definida como: (148) 𝒜 ⁢ [ u ] := ∫ Ω d 4 ⁢ x ⁢ ℒ ⁢ [ u ; ∂ ⁡ u ] ⁢ ( x ) , com ℒ a densidade lagrangiana de primeira ordem, isto é, que depende das derivadas dos campos de até primeira ordem. Se aplicarmos uma transformação cujos efeitos nas coordenadas e campos são dados, infinitesimalmente, pelas equações: (149) x ′ ⁣ μ = x μ + δ ⁢ x μ , u ′ ⁣ A ⁢ ( x ′ ) = u A ⁢ ( x ) + δ ⁢ u A ⁢ ( x ) , então, frente a essa transformação, a ação tem variação: (150) δ ⁢ 𝒜 ⁢ [ u ] := ∫ Ω ′ d 4 ⁢ x ′ ⁢ ℒ ⁢ [ u ′ ; ∂ ′ ⁡ u ′ ] ⁢ ( x ′ ) - ∫ Ω d 4 ⁢ x ⁢ ℒ ⁢ [ u ; ∂ ⁡ u ] ⁢ ( x ) = ∫ Ω d 4 ⁢ x ⁢ ( δ ⁢ ℒ + ℒ ⁢ ∂ μ ⁡ δ ⁢ x μ ) . Essa expressão pode ser escrita de forma conveniente definindo a derivada de Euler da densidade lagrangiana, (151) δ ⁢ ℒ δ ⁢ u A := ∂ ⁡ ℒ ∂ ⁡ u A - ∂ μ ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u A ) , e a quantidade: (152) Θ := ν μ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u A ) ∂ ν u A - δ ℒ ν μ . Então a equação (150) é equivalente a: (153) δ 𝒜 [ u ] = ∫ Ω d 4 x { δ ⁢ ℒ δ ⁢ u A ( δ u A - ∂ μ u A δ x μ ) - ∂ μ [ Θ δ ν μ x ν - ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u A ) δ u A ] } . Escrita nesta forma é possível a aplicação direta de princípios variacionais à integral de ação: Princípio da ação estacionária(de Ostrogradskii-Hamilton): Campo físico é aquele cuja forma funcional (δxμ = 0) é tal que, entre duas configurações fixas do sistema (δuA(x)|∂Ω = 0), a integral de ação adota um valor estacionário (δ𝒜[u] = 0) qualquer que seja a região Ω.□ As equações de Euler-Lagrange são consequência do princípio da ação estacionária, pois a equação (153) implica que: (154) δ ⁢ ℒ δ ⁢ u A = 0 ; A = 1 , ⋯ , N . Primeiro teorema de Nöther:Se a integral de ação de um dado sistema físico é invariante, até termos de superfície, em relação a certo grupo de Lie Gr de r parâmetros, então r combinações linearmente independentes de derivadas de Euler da densidade lagrangiana são iguais a divergências.□ Prova: Denotemos por ϵa (a = 1,⋯, r) os parâmetros do grupo Gr, e consideremos que a transformação age sobre as coordenadas e campos mediante as representações Xa e Ia, respectivamente; ou seja: (155) δ ⁢ x μ = ϵ a ⁢ [ X a ⁢ x ] μ , δ ⁢ u A = ϵ a ⁢ [ I a ⁢ u ] A . Por hipótese do teorema, a ação é invariante, até termos de superfície, frente às transformações da equação (155): ∫∂⁡Ωd4⁢x⁢∂μ⁡(ϵa⁢δa⁢Ωμ). Portanto, na equação (153): (156) ∫ Ω d 4 x { δ ⁢ ℒ δ ⁢ u A ( [ I a u ] A - ∂ μ u A [ X a x ] μ ) - ∂ μ J } a μ ϵ a = 0 , com: (157) J := a μ Θ [ X a x ] ν ν μ - ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u A ) [ I a u ] A - δ a Ω μ . Ora a independência linear dos parâmetros do grupo Gr, ϵa, nos permite escrever a tese do teorema: (158) δ ⁢ ℒ δ ⁢ u A ( [ I a u ] A - ∂ μ u A [ X a x ] μ ) = ∂ μ J ; a μ a = 1 , ⋯ , r , quod erat demonstrandum . ■ Para campos físicos, as identidades da equação (158) se tornam r leis de conservação das densidades de corrente Jaμ, pois o lado esquerdo delas se anula por ser proporcional às equações de Euler-Lagrange. Como elas regem apenas sob a imposição dos campos serem físicos, a elas se chama «leis de conservação débeis». Neste caso, as correspondentes cargas conservadas, chamadas «cargas de Nöther», são obtidas por integração da densidade de corrente sobre uma superfície Σ com elemento de área d3σμ = d3σnμ, com nμ o vetor normal a Σ: (159) Q a := ∫ Σ d 3 σ ( x ) n μ J ( x ) a μ . Na dinâmica da frente de luz, a superfície Σ é o plano nulo x(+)=x0(+)=constante. Este plano é, como já foi observado, gerado pelos vetores e(⊥) e e(− ), e, portanto, tem vetor normal n = e(− ), ortogonal a eles [note que o vetor e(+), que poderíamos pensar inicialmente que fosse o vetor normal, falha, pois não é ortogonal a e(− ), segundo a equação (142)]. Substituindo na equação (159): (160) Q a = ∫ x ( + ) = x 0 ( + ) d 3 x ¯ e ( - ) ⁢ μ J ( x ) a μ = ∫ x ( + ) = x 0 ( + ) d 3 x ¯ J ( x ) a ( + ) ; (161) d ⁢ Q a d ⁢ x ( + ) = 0 . Tipicamente, as densidades de corrente são formas bilineares dos campos, então as cargas de Nöther existirão (a integral que as define será convergente) se os campos, assim como suas derivadas transversais e longitudinal, são de quadrado integrável no plano nulo. Essas condições assintóticas requeridas para a existência das cargas de Nöther, vemos, incluem a condição assintótica da equação (133) que substituia os dados iniciais na superfície característica x(− ) = constante. Consideremos, particularmente, o gerador das translações temporais no plano nulo, isto é, o hamiltoniano. Consideremos a seguinte translação em forma covariante: x′⁣ μ = xμ + ϵμ, u′⁣ A(x′) = uA(x), ou: (162) [ X ν x ] μ = δ , ν μ [ I ν u ] A = 0 . Também, como a densidade lagrangiana é escalar frente a transformações do grupo de Poincaré, teremos que δℒ = 0. Isto na equação (150) implica que a integral de ação é invariante sob translações, pois os parâmetros ϵμ são constantes, e assim δνΩμ = 0. Substituindo a equação (162) na equação (157), obtemos a densidade de corrente conservada: (163) J = ν μ Θ [ X ν x ] σ σ μ = Θ , ν μ que é chamada «tensor de energia-momento». A carga de Nöther que lhe corresponde, com respeito ao plano nulo, é o «vetor de energia-momento» com componentes [vide a equação (160)]: (164) P ν = ∫ x ( + ) = x 0 ( + ) d 3 x ¯ Θ . ν ( + ) As componentes invariantes desse vetor são obtidas projetando seu índice ν com o campo de tétradas da dinâmica da frente de luz: (165) P ( a ) = e P ν ( a ) ν = ∫ d 3 x ¯ e Θ ( a ) ν = ν ( + ) ∫ d 3 x ¯ Θ . ( a ) ( + ) Assim, o momento invariante no plano nulo é: (166) P ( ⊥ ) = ∫ d 3 x ¯ Θ , ( ⊥ ) ( + ) P ( - ) = ∫ d 3 x ¯ Θ , ( - ) ( + ) enquanto que o hamiltoniano invariante tem expressão: (167) H P ⁢ N ≡ P ( + ) = ∫ d 3 x ¯ Θ ( + ) ( + ) = ∫ d 3 ⁢ x ¯ ⁢ Θ ( - ) ⁢ ( + ) . E sobre a teoria lagrangiana geral do campo clássico basta o que foi dito. O segundo teorema de Nöther, referente à localização das simetrias, isto é, à ampliação do grupo de simetrias Gr que se obtém ao fazer os parâmetros do grupo depender do ponto x do espaço-tempo, leva imediatamente às teorias de calibre e, assim, aos campos em interação. Isto o deixamos para um próximo trabalho. Focaremos nossa atenção agora em estudar os diversos campos particulares usados na modelagem da matéria. E uma vez clara a ideia subjacente às coordenadas invariantes, deixaremos de escrever os índices entre parênteses. apresentamos um breve resumo da teoria clássica do campo em forma covariante. Já as seções 6 6. Campo escalar Seja (φ, φ∗) um campo escalar complexo, cujas equações de movimento são as de Klein-Gordon-Fock: (168) ( □ + m 2 ) ⁢ φ ⁢ ( x ) = 0 ; ( □ + m 2 ) ⁢ φ * ⁢ ( x ) = 0 . Como não há outras equações além dessas, o problema de Goursat para o campo escalar é simplesmente aquele que já estudamos na seção 3. A densidade lagrangiana que deriva nessas equações é a seguinte: (169) ℒ φ = ∂ μ ⁡ φ * ⁢ ∂ μ ⁡ φ - m 2 ⁢ φ * ⁢ φ . A substituição dela na equação (152) nos permite obter o tensor de energia-momento desse campo: (170) Θ = ν μ ∂ ⁡ ℒ φ ∂ ⁡ ( ∂ μ ⁡ φ ) ∂ ν φ + ∂ ⁡ ℒ φ ∂ ⁡ ( ∂ μ ⁡ φ * ) ∂ ν φ * - δ ℒ φ ν μ = ∂ μ φ * ∂ ν φ + ∂ ν φ * ∂ μ φ - δ ∂ σ ν μ φ * ∂ σ φ + m 2 ⁢ δ ⁢ φ * ν μ ⁢ φ . O hamiltoniano invariante do plano nulo será portanto [equação (166)]: (171) H P ⁢ N ; φ = ∫ d 3 ⁢ x ¯ ⁢ [ ∂ ⊥ ⁡ φ * ⁢ ∂ ⊥ ⁡ φ + m 2 ⁢ φ * ⁢ φ ] . Consideremos agora a equação de Klein-Gordon-Fock [equação (168)] à que o campo escalar obedece. Nas coordenadas do plano nulo, o operador D’Alembertiano adota a forma: (172) □ = 2 ⁢ ∂ + ⁡ ∂ - - ( ∂ ⊥ ) 2 ; ( ∂ ⊥ ) 2 = ∂ 1 2 + ∂ 2 2 . A solução dela será facilmente encontrada ao tomarmos a transformada de Fourier do campo: (173) φ ⁢ ( x ) = ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 4 ⁢ p ⁢ φ ^ ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x = ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d p + ⁢ d p - ⁢ d 2 ⁢ p ⊥ ⁢ φ ^ ⁢ ( p ) × e - i ⁢ ( p + ⁢ x + + p - ⁢ x - + p ⊥ ⁢ x ⊥ ) , e daí que: (174) ( □ + m 2 ) ⁢ φ ⁢ ( x ) = - ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d p + ⁢ d p - ⁢ d 2 ⁢ p ⊥ × ( 2 p + p - - ω p 2 ) φ ^ ( p ) e - i ⁢ p ⁢ x = 0 ; aqui: ωp2:=m2+(p⊥)2. Vemos que deverá ser satisfeita a relação: (2⁢p+⁢p--ωp2)⁢φ^⁢(p)=0, cuja solução distribucional é dada por [62]: (175) φ ^ ⁢ ( p ) = δ ⁢ ( 2 ⁢ p + ⁢ p - - ω p 2 ) ⁢ φ ⁢ ( p ) = 1 | 2 ⁢ p - | ⁢ δ ⁢ ( p + - ω p 2 2 ⁢ p - ) ⁢ φ ⁢ ( p ) , com φ(p) uma função arbitrária. Substituindo na equação (173) e separando a região de integração da variável p+ no domínio positivo e no negativo: (176) φ ⁢ ( x ) = ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 2 ⁢ p ⊥ ⁢ ∫ - ∞ + ∞ d p - × { ∫ - ∞ 0 d ⁢ p + | 2 ⁢ p - | δ ( p + - ω p 2 2 ⁢ p - ) φ ( p ) e - i ⁢ p ⁢ x + ∫ 0 + ∞ d ⁢ p + | 2 ⁢ p - | δ ( p + - ω p 2 2 ⁢ p - ) φ ( p ) e - i ⁢ p ⁢ x } . Façamos na primeira integral a substituição p → − p; usando então a propriedade de simetria da distribuição delta de Dirac, isto é, que δ(x) = δ(− x), obtemos que: (177) φ ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 2 ⁢ p ⊥ ⁢ ∫ - ∞ + ∞ d p - ⁢ ∫ 0 + ∞ d ⁢ p + | 2 ⁢ p - | × δ ⁢ ( p + - ω p 2 2 ⁢ p - ) ⁢ [ φ ⁢ ( - p ) ⁢ e i ⁢ p ⁢ x + φ ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x ] . Como é indicado pelos limites de integração, aqui é p+ > 0. Mas o suporte da distribuição delta de Dirac exige que seja p+=ωp2/2⁢p-, e como ωp2>0, é forçoso que seja p− > 0. Assim é que devemos introduzir a função de Heaviside Θ(p−) e então escrever: (178) φ ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 2 ⁢ p ⊥ ⁢ ∫ d p - ⁢ ∫ 0 + ∞ d ⁢ p + | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × δ ⁢ ( p + - ω p 2 | 2 ⁢ p - | ) ⁢ [ φ ⁢ ( - p ) ⁢ e i ⁢ p ⁢ x + φ ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x ] . Integrando finalmente a variável p+: (179) φ ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × [ φ ⁢ ( - p ) ⁢ e i ⁢ p ⁢ x + φ ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x ] | p + = E , em que temos escrito: d3⁢p¯:=d2⁢p⊥⁢d⁢p-, e com a energia E definida segundo: E:=ωp2/|2⁢p-|>0. Note que essa expressão é relativisticamente correta, pois a medida de integração é invariante sob transformações de Poincaré: (180) ∫ d 2 ⁢ p ⊥ ⁢ d ⁢ p - | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) = ∫ d 4 ⁢ p | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) ⁢ δ ⁢ ( p + - E ) = ∫ d 4 ⁢ p ⁢ Θ ⁢ ( p - ) ⁢ δ ⁢ ( 2 ⁢ p + ⁢ p - - ω p 2 ) = ∫ d 4 ⁢ p ⁢ Θ ⁢ ( p - ) ⁢ δ ⁢ ( p 2 - m 2 ) . Lembremos, por outro lado, que Θ(p−) é invariante sob transformações de Poincaré ortócronas, pois p− é uma coordenada do tipo-luz. É habitual realizar a normalização seguinte11 [53]: (181) φ ⁢ ( p ¯ ) := φ ⁢ ( p ) | 2 ⁢ p - | , φ ⁢ ( - p ¯ ) := φ ⁢ ( - p ) | 2 ⁢ p - | , com a qual: (182) φ ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × [ φ ⁢ ( p ¯ ) ⁢ e - i ⁢ p ⁢ x + φ ⁢ ( - p ¯ ) ⁢ e i ⁢ p ⁢ x ] | p + = E . Finalmente, se o campo clássico é real, isto é, se φ(x) = φ∗(x), então sobre as amplitudes dos diferentes modos deve-se impor a condição: (183) φ ⁢ ( - p ) * = φ ⁢ ( p ) , φ ⁢ ( p ) * = φ ⁢ ( - p ) . Assim, a expansão em série de Fourier do campo escalar real é: (184) φ ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × [ φ ⁢ ( p ¯ ) ⁢ e - i ⁢ p ⁢ x + φ ⁢ ( p ¯ ) * ⁢ e i ⁢ p ⁢ x ] | p + = E . , 7 7. Campo de Dirac Consideremos agora o campo fermiônico de Dirac (ψ,ψ¯). As equações de Dirac são12: (185) ( i ⁢ ∂̸ - m ) ⁢ ψ ⁢ ( x ) = 0 , ψ ¯ ⁢ ( x ) ⁢ ( i ⁢ ∂̸ ← + m ) = 0 , as quais provêm da densidade lagrangiana: (186) ℒ ψ = ψ ¯ ⁢ ( i 2 ⁢ ∂̸ ↔ - m ) ⁢ ψ . O tensor de energia-momento desse campo é obtido por substituição dessa densidade lagrangiana na equação (152): (187) Θ = ν μ ∂ ⁡ ℒ ψ ∂ ⁡ ( ∂ μ ⁡ ψ ) ∂ ν ψ + ∂ ν ψ ¯ ∂ ⁡ ℒ φ ∂ ⁡ ( ∂ μ ⁡ ψ ¯ ) - δ ℒ ψ ν μ = i 2 ⁢ ( ψ ¯ ⁢ γ μ ⁢ ∂ ν ⁡ ψ - ∂ ν ⁡ ψ ¯ ⁢ γ μ ⁢ ψ ) - δ ⁢ ψ ¯ ν μ ⁢ ( i 2 ⁢ ∂̸ ↔ - m ) ⁢ ψ . O hamiltoniano invariante do plano nulo será portanto: (188) H P ⁢ N ; ψ = ∫ d 3 ⁢ x ¯ ⁢ [ - i 2 ⁢ ψ ¯ ⁢ ( γ - ⁢ ∂ ↔ - + γ ⊥ ⁢ ∂ ↔ ⊥ ) ⁢ ψ + m ⁢ ψ ¯ ⁢ ψ ] . 7.1. Componentes dinâmicase não-dinâmicas Investiguemos em detalhe a equação de Dirac [equação (185)]. Nas coordenadas do plano nulo, separando a derivada temporal ∂+: (189) i ⁢ γ + ⁢ ∂ + ⁡ ψ = ( m - i ⁢ γ - ⁢ ∂ - - i ⁢ γ ⊥ ⁢ ∂ ⊥ ) ⁢ ψ . A matriz γ+ não pode ser invertida,13 pois ela tem determinante nulo (isto pode ser visto, bem por cálculo direto, por exemplo, na representação quiral ou em qualquer outra, bem pelo fato de que seu quadrado é nulo devido à relação de anti-comutação a que as matrizes de Dirac satisfazem –o que indica que também a matriz γ− é não invertível–). Portanto, poderemos isolar a derivada temporal de forma a escrever a equação (189) na forma da equação de Schrödinger somente pela definição dos projetores: (190) Λ ± := 1 2 ⁢ ( 1 ± γ 0 ⁢ γ 3 ) = 1 2 ⁢ γ 0 ⁢ γ ± , os quais exibem as seguintes propriedades: (191) Λ ± 2 = Λ ± ; Λ ± ⁢ Λ ∓ = 0 ; Λ + + Λ - = 1 , como é possível provar por cálculo direto. Da mesma forma podem ser mostradas as igualdades que seguem: (192) Λ ± ⁢ γ 0 = γ 0 ⁢ Λ ∓ , Λ + ⁢ γ 0 ⁢ γ - = 0 , Λ - ⁢ γ 0 ⁢ γ - = γ 0 ⁢ γ - ⁢ Λ - , Λ ± ⁢ γ 0 ⁢ γ ⊥ = γ 0 ⁢ γ ⊥ ⁢ Λ ∓ . Finalmente, definimos as duas projeções do campo de Dirac segundo: (193) ψ ± := Λ ± ⁢ ψ ; ψ = ψ + + ψ - . Com isto, multiplicando a equação (189) por γ0 pela esquerda e usando a definição de Λ+, obtemos: (194) i ⁢ 2 ⁢ ∂ + ⁡ ψ + = γ 0 ⁢ ( m - i ⁢ γ - ⁢ ∂ - - i ⁢ ∂ ⊥ ⁡ ∂ ⊥ ) ⁢ ψ . Multiplicando pela esquerda por Λ+ e usando as propriedades mostradas na equação (192), chegamos a: (195) i ⁢ 2 ⁢ ∂ + ⁡ ψ + = γ 0 ⁢ ( m - i ⁢ γ ⊥ ⁢ ∂ ⊥ ) ⁢ ψ - . Análogamente, multiplicando a equação (194) por Λ− pela esquerda e usando a equação (192): (196) i ⁢ 2 ⁢ ∂ - ⁡ ψ - = γ 0 ⁢ ( m - i ⁢ γ ⊥ ⁢ ∂ ⊥ ) ⁢ ψ + . A equação (195) é uma equação dinâmica para a componente ψ+; ela é portanto chamada «componente dinâmica» do campo de Dirac. A equação (196), por outro lado, não é uma equação dinâmica para ψ−, visto que nenhuma derivada temporal aparece nela; ψ− é chamada «componente não-dinâmica», e a equação (196) é uma equação de vínculo, a qual pode ser invertida da forma seguinte, explicitando o fato de que ψ− é automaticamente conhecida uma vez que o é ψ+: (197) ψ - = 1 i ⁢ 2 ⁢ ∂ - ⁢ γ 0 ⁢ ( m - i ⁢ γ ⊥ ⁢ ∂ ⊥ ) ⁢ ψ + . Este vínculo pode ser usado para eliminar ψ− na equação (195). Encontramos que a equação de movimento da componente dinâmica do campo de Dirac não é senão a equação de Klein-Gordon-Fock: (198) ( □ + m 2 ) ⁢ ψ + = 0 . 7.2. Problema de Goursat O problema de Goursat para o campo de Dirac pode ser abordado da mesma forma que na seção 3: Solucionando primeiro o problema de Cauchy (na dinâmica instantânea) e passando depois à dinâmica do plano nulo por aplicação do teorema de Gauss num volume convenientemente escolhido. Como, no entanto, este caminho já foi percorrido anteriormente –e não encontraremos dificuldades em percorrê-lo para o caso presente se assim o desejarmos–, é mais instrutivo oferecer uma outra forma de obter a desejada solução. Tal o faremos explorando a divisão recém feita entre as componentes dinâmicas e as não-dinâmicas. Devido a que as componentes dinâmicas satisfazem a equação de Klein-Gordon-Fock [equação (198)], seu problema de Goursat tem a solução dada na equação (134), que por uma integração por partes pode ser escrita da seguinte forma: (199) ψ + ⁢ ( x ) = ∫ y + = y 0 + d 3 ⁢ y ¯ ⁢ 2 ⁢ ∂ - x ⁡ D ⁢ ( x - y ) ⁢ ψ + ⁢ ( y ) . As componentes não-dinâmicas são então determinadas pela substituição da equação (199) na (197), da qual obtemos: (200) ψ - ⁢ ( x ) = - i ⁢ 2 × ∫ y + = y 0 + d 3 y ¯ γ 0 ( m - i γ ⊥ ∂ ⊥ x ) D ( x - y ) ψ + ( y ) . E pelo uso das definições mostradas na equação (193): (201) ψ ( x ) = ∫ y + = y 0 + d 3 y ¯ [ 2 ∂ - x - i 2 γ 0 ( m - i γ ⊥ ∂ ⊥ x ) ] D ( x - y ) Λ + ψ ( y ) . Usando então as equações (190)–(192), assim como o fato, já mencionado, de ser (γ+)2 = 0, vemos que é possível escrever a equação (201) na forma sucinta: (202) ψ ⁢ ( x ) = - i ⁢ ∫ y + = y 0 + d 3 ⁢ y ¯ ⁢ S ⁢ ( x - y ) ⁢ γ + ⁢ ψ ⁢ ( y ) , com a distribuição S(x) definida como: (203) S ⁢ ( x ) := ( i ⁢ ∂̸ + m ) ⁢ D ⁢ ( x ) . Tendo encontrado a solução –o que, já o dissemos, imediatamente implica que ela é única– podemos afirmar que o problema de Goursat para o campo de Dirac está bem definido. Por outro lado, no problema de Cauchy seria necessário conhecer o campo ψ(0; x), que faz um total de quatro funções, pois as derivadas dele não serão necessárias devido a que a equação de Dirac é uma equação de primeira ordem; o mesmo número de dados é necessário na solução que apresentamos e na qual usamos a equação (199), que implica o conhecimento de ψ+ em x+ = 0 e x-=x0-, fazendo igualmente um total de quatro funções –sendo que essa última tem sido substituída por uma condição assintótica, o que não muda o número de dados iniciais–. 7.3. Espinores de polarização Como cada uma das componentes do campo de Dirac, ψa(x), satisfaz a equação de Klein-Gordon-Fock, (204) ( □ + m 2 ) ⁢ ψ a ⁢ ( x ) = 0 , cada uma delas irá ter uma expressão semelhante àquela da equação (182): (205) ψ a ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × [ ψ a ⁢ ( p ¯ ) ⁢ e - i ⁢ p ⁢ x + ψ a ⁢ ( - p ¯ ) ⁢ e i ⁢ p ⁢ x ] | p + = E . As amplitudes espinoriais ψ⁢(p¯) que aqui aparecem devem ser tais que ψa(x) satisfaça a equação de Dirac [equação (185)]: Elas carregam a informação «adicional» não contida na equação de Klein-Gordon-Fock, isto é, a informação dos vínculos da teoria. Logo tais amplitudes definem os possíveis estados de polarização do campo de Dirac. Substituindo a equação (205) na (185): (206) 0 = ( i ⁢ ∂̸ - m ) ⁢ ψ ⁢ ( x ) = ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × [ ( p̸ - m ) ⁢ ψ ⁢ ( p ¯ ) ⁢ e - i ⁢ p ⁢ x - ( p̸ + m ) ⁢ ψ ⁢ ( - p ¯ ) ⁢ e i ⁢ p ⁢ x ] | p + = E . Daqui concluímos que, uma vez que as soluções de freqüências positivas e as de freqüências negativas são linearmente independentes, deverão ser verificadas as equações: (207) ( p̸ - m ) ⁢ ψ ⁢ ( p ¯ ) = 0 ; ( p̸ + m ) ⁢ ψ ⁢ ( - p ¯ ) = 0 . Apresentaremos a seguir a solução para essas equações, inspirados na Ref. [23]. Comecemos com: (208) ( p̸ - m ) ⁢ u ⁢ ( p ¯ ) = 0 . De forma semelhante a que foram obtidas as equações (195) e (196), encontramos que: (209) 2 ⁢ p + ⁢ u + = γ 0 ⁢ ( m - γ ⊥ ⁢ p ⊥ ) ⁢ u - , (210) 2 ⁢ p - ⁢ u - = γ 0 ⁢ ( m - γ ⊥ ⁢ p ⊥ ) ⁢ u + , lembrando que é p+ = E [vide a equação (206)]. A estratégia para solucionar essas equações será escrever uma base para uma das projeções do espinor e usar, então, a (209) ou a (210) para encontrar a outra. No apêndice B mostra-se a forma explícita dos projetores [equação (300)], da qual observamos que uma base para u− será: (211) u - ( 1 ) = ( 0 1 0 0 ) , u - ( - 1 ) = ( 0 0 1 0 ) . Os espinores u+ correspondentes são obtidos usando a equação (209): (212) u + ( 1 ) = 1 2 ⁢ E ⁢ ( - p 1 + i ⁢ p 2 0 0 m ) , (213) u + ( - 1 ) = 1 2 ⁢ E ⁢ ( m 0 0 p 1 + i ⁢ p 2 ) . Ora, a equação (193) implica que a solução completa é obtida somando as componentes u− e u+, o que leva a obter: (214) u 1 = a 0 2 ⁢ E ⁢ ( - p 1 + i ⁢ p 2 2 ⁢ E 0 m ) , (215) u - 1 = a 0 2 ⁢ E ⁢ ( m 0 2 ⁢ E p 1 + i ⁢ p 2 ) . Nessas expressões, a0 é um fator de normalização, que escolheremos convenientemente como sendo14: (216) a 0 = E 2 ⁢ | p - | . Com isto: (217) u 1 = 1 2 ⁢ E ⁢ 2 ⁢ | p - | ⁢ ( - p 1 + i ⁢ p 2 2 ⁢ E 0 m ) , (218) u - 1 = 1 2 ⁢ E ⁢ 2 ⁢ | p - | ⁢ ( m 0 2 ⁢ E p 1 + i ⁢ p 2 ) . Assim é que podemos diretamente calcular: u 1 ⁢ u 1 † + u - 1 ⁢ u - 1 † = 1 2 ⁢ E ⁢ 2 ⁢ | p - | × ( p ⊥ 2 + m 2 - 2 ⁢ E ⁢ ( p 1 - i ⁢ p 2 ) - 2 ⁢ E ⁢ ( p 1 + i ⁢ p 2 ) 2 ⁢ E 2 2 ⁢ m ⁢ E 0 0 2 ⁢ m ⁢ E 2 ⁢ m ⁢ E 0 0 2 ⁢ m ⁢ E 2 ⁢ E 2 2 ⁢ E ⁢ ( p 1 - i ⁢ p 2 ) 2 ⁢ E ⁢ ( p 1 + i ⁢ p 2 ) p ⊥ 2 + m 2 ) . Multiplicando pela direita por γ0: (219) u 1 ⁢ u ¯ 1 + u - 1 ⁢ u ¯ - 1 = 1 | 2 ⁢ p - | × ( m 0 2 ⁢ | p - | - ( p 1 - i ⁢ p 2 ) 0 m - ( p 1 + i ⁢ p 2 ) 2 ⁢ E 2 ⁢ E p 1 - i ⁢ p 2 m 0 p 1 + i ⁢ p 2 2 ⁢ | p - | 0 m ) . E portanto, lembrando da representação de Weyl das matrizes de Dirac [apêndice B], reconhecemos que a equação anterior se iguala a: (220) ∑ s = ± 1 u s ⁢ u ¯ s = E ⁢ γ + + | p - | ⁢ γ - + p ⊥ ⁢ γ ⊥ + m | 2 ⁢ p - | . Demos agora, por método análogo, solução à segunda das equações (207): (221) ( p̸ + m ) ⁢ v = 0 , da qual se segue, após projeção com Λ±, que as componentes do espinor v se relacionam por: (222) v + = - γ 0 ⁢ ( m + p ⊥ ⁢ γ ⊥ ) 2 ⁢ E ⁢ v - . Usando a mesma base apresentada na equação (211) para os espinores v− e usando a relação da equação (222), obtemos: (223) v + ( 1 ) = - 1 2 ⁢ E ⁢ ( p 1 - i ⁢ p 2 0 0 m ) , (224) v + ( - 1 ) = - 1 2 ⁢ E ⁢ ( m 0 0 - p 1 - i ⁢ p 2 ) . A equação (193) implica por sua vez que a solução completa é: (225) v 1 = 1 2 ⁢ E ⁢ 2 ⁢ | p - | ⁢ ( - p 1 + i ⁢ p 2 2 ⁢ E 0 - m ) , (226) v - 1 = 1 2 ⁢ E ⁢ 2 ⁢ | p - | ⁢ ( - m 0 2 ⁢ E p 1 + i ⁢ p 2 ) . O cálculo direto mostra também que a seguinte regra de soma rege para os espinores de polarização vs: (227) ∑ s = ± 1 v s ⁢ v ¯ s = E ⁢ γ + + | p - | ⁢ γ - + p ⊥ ⁢ γ ⊥ - m | 2 ⁢ p - | . , 8 8. Campo eletromagnético As equações do campo eletromagnético são as equações de Maxwell, que no espaço vazio se leem [60, 61] (em unidades com c = 1, como temos determinado de início): (228) ∇ ⋅ E = 0 ; ∇ ⋅ B = 0 ; ∇ × E + ∂ ⁡ B ∂ ⁡ t = 0 ; ∇ × B - ∂ ⁡ E ∂ ⁡ t = 0 . Em função do «tensor de Faraday» Fμν, definido da forma seguinte: (229) [ F μ ⁢ ν ] := ( 0 E x E y E z - E x 0 - B z B y - E y B z 0 - B x - E z - B y B x 0 ) = - [ F ν ⁢ μ ] , as equações de Maxwell no vácuo se escrevem: (230) ∂ μ ⁡ F μ ⁢ ν = 0 , ∂ ρ ⁡ F μ ⁢ ν + ∂ μ ⁡ F ν ⁢ ρ + ∂ ν ⁡ F ρ ⁢ μ = 0 , essa última conhecida como «identidade de Bianchi». Essas equações permitem a introdução do «potencial eletromagnético», Aμ(x), segundo: (231) F μ ⁢ ν = : ∂ μ A ν - ∂ ν A μ . A este campo chamaremos doravante «campo eletromagnético», ou às vezes –para explicitar que ele será considerado livre– «campo da radiação». Ao passo que a identidade de Bianchi se mantém idênticamente satisfeita, a equação do movimento do campo eletromagnético [primeira das equações (230)] se reescreve: (232) □ ⁢ A ν ⁢ ( x ) - ∂ ν ⁡ ( ∂ μ ⁡ A μ ⁢ ( x ) ) = 0 , que pode ser obtida da densidade lagrangiana: (233) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν . 8.1. Componentes dinâmicas e não-dinâmicas. Condição de gauge do plano nulo Poderia parecer, olhando para a equação (232), que o campo de radiação não está obrigado a satisfazer a equação de Klein-Gordon-Fock. No entanto, o termo adicional pode ser removido pela imposição de uma condição subsidiária (condição de gauge ou de calibre) cuja possibilidade se manifesta pela não unicidade da relação entre o potencial e os campos E e B: Estes não são modificados se o potencial é redefinido pela adição de um termo de divergência, Aμ → Aμ + ∂μ f.15 Para tal remoção bastará exigir que seja ∂ν⁡(∂μ Aμ) = 0, que é o mesmo que ∂μ Aμ = constante; impondo então que o campo se anule no infinito, a constante deve por força ser nula e, assim, a equação de Klein-Gordon-Fock é obedecida sob a «condição de gauge de Lorenz»16: (234) ∂ μ ⁡ A μ ⁢ ( x ) = ∂ + ⁡ A + + ∂ ⊥ ⁡ A ⊥ + ∂ - ⁡ A - = 0 . Essa condição de gauge elimina um grau de liberdade da teoria, mas não elimina por completo a liberdade de gauge, pois ainda a equação de Klein-Gordon-Fock e a condição de gauge de Lorenz serão satisfeitas simultâneamente caso se opere uma transformação de gauge com uma função harmônica,17 □ f = 0. Para eliminar por completo a liberdade de gauge deve ser imposta uma condição adicional; a simplificação máxima na dinâmica da frente de luz consiste em tornar a condição de gauge de Lorenz numa relação puramente cinemática, eliminando toda dependência temporal nela; para tal será suficiente exigir que seja ∂+A+ = 0, mas então a equação □ A+ = 0 será igual a ∂⊥2⁡A+=0, cuja solução, sob as condições assintóticas de desvanecimento no infinito, é a nula. A essa se chama a «condição de gauge do plano nulo»18: (235) A + ⁢ ( x ) = 0 . Isto elimina toda a liberdade de gauge, mostrando que o campo eletromagnético possue dois graus de liberdade. Efetivamente, toda a informação está contida nas equações dinâmicas para as componentes transversais: (236) □ ⁢ A α ⁢ ( x ) = 0 , e nas equações de vínculo que provêm das condições de gauge [equações (234) e (235)]: (237) A + = 0 , A - = - 1 ∂ - ⁢ ∂ α ⁡ A α . As componentes transversais Aα são chamadas «componentes dinâmicas» do campo de radiação, enquanto que A+ e A− são as «não-dinâmicas», por estarem totalmente determinadas pelos vínculos. É útil mencionar adicionalmente que, como afirmado nas Refs. [14, 15, 24], a análise que fizemos antes do problema de Goursat [vide a seção 3] pode ser fácilmente extendida para um campo Φ(x) que obedece a equações do tipo: (238) ∂ + ⁡ ∂ - ⁡ Φ ⁢ ( x ) = L ⁢ Φ ⁢ ( x ) + Ψ ⁢ ( x ) , com L um operador diferencial linear que não contém derivadas temporais ∂+ e Ψ(x) um campo diferente do Φ(x). As equações (232) são desse tipo para ν = 1, 2 somente sob a condição de gauge do plano nulo. A equação para ν = + se equivale então à condição de gauge de Lorenz com A+ = 0 –sob as condições assintóticas que estamos usando–, e esta torna uma identidade a equação para ν = − . As duas condições de gauge, de qualquer forma, são compatíveis –no caso livre– e devem ser usadas simultâneamente. No gauge do plano nulo, a densidade lagrangiana da equação (233) se simplifica a: (239) ℒ A = ∂ + ⁡ A ⊥ ⁢ ∂ - ⁡ A ⊥ + ∂ - ⁡ A ⊥ ⁢ ∂ ⊥ ⁡ A - - 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 + 1 2 ⁢ ( ∂ - ⁡ A - ) 2 . Ou ainda, em função das componentes dinâmicas só: (240) ℒ A = ∂ + ⁡ A ⊥ ⁢ ∂ - ⁡ A ⊥ + ( A α ⁢ ∂ α ) ⁢ ( ∂ β ⁡ A β ) + 1 2 ⁢ ( ∂ ⊥ ⁡ A ⊥ ) 2 - 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 . O tensor de energia-momento é: (241) Θ = ν μ ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A σ ) ∂ ν A σ - δ ν μ ℒ A = F ∂ ν σ μ A σ + 1 4 δ F σ ⁢ τ ν μ F σ ⁢ τ . Particulamente, o hamiltoniano invariante no gauge do plano nulo é: (242) H N ⁢ P ; A = ∫ d 3 x ¯ [ 1 2 ( ∂ 1 A 2 - ∂ 2 A 1 ) 2 - ∂ - A ⊥ ∂ ⊥ A - - 1 2 ( ∂ - A - ) 2 ] . Ou, escrito somente em função das componentes dinâmicas: (243) H N ⁢ P ; A = ⁢ ∫ d 3 ⁢ x ¯ ⁢ [ 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 + 1 2 ⁢ ( ∂ ⊥ ⁡ A ⊥ ) 2 ] . 8.2. Problema de Goursat O problema de Goursat para o campo eletromagnético possui uma consequência notável: Ele garante a preservação no tempo das condições de gauge. Com efeito, dada a equação (236), as componentes transversais têm a solução: (244) A α ⁢ ( x ) = ∫ y + = y 0 + d 3 ⁢ y ¯ ⁢ D 0 ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ A α ⁢ ( y ) , com o subíndice «0» sob a distribuição de Jordan-Pauli indicando que nela a massa é nula: m = 0. Escrevamos a solução completa da forma: (245) A a ( x ) = ∫ y + = y 0 + d 3 y ¯ D ( x - y ) b a ∂ ↔ - y A b ( y ) . A equação (244) é recuperada sob a condição de ser: (246) D = β α δ β α D 0 , D = - α 0 , enquanto que as condições de vínculo da equação (237) são satisfeitas, uma vez impostas no plano nulo y+=y0+, se: (247) D = α + 0 , D = - + 0 , D = - - 0 , D = α - - 1 ∂ - ∂ α D 0 . Nota-se que não é preciso exigirmos valores particulares de D+a, uma vez que imporemos que seja A+ = 0 no plano nulo inicial. Todas essas condições são satisfeitas com a escolha: (248) D = b a ( δ b a - η a ⁢ ∂ b + η b ⁢ ∂ a ∂ - ) D 0 ( x ) , (249) ( η a ) = ( 0 ; 0 ⊥ ; 1 ) . Assim, se no plano y+=y0+ são impostas as condições de gauge de Lorenz e do plano nulo, então elas se manterão em todo tempo posterior na evolução dinâmica do campo. 8.3. Vetores de polarização Já dissemos repetidamente que sob a condição de gauge de Lorenz cada componente do campo da radiação satisfaz a equação de Klein-Gordon-Fock: (250) □ ⁢ A a ⁢ ( x ) = 0 . Consequentemente, cada uma dessas componentes poderá ser expandida como uma integral de Fourier como na equação (179): (251) A a ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × ∑ λ ( ε λ ( p ¯ ) a ⁣ * A ( λ ; p ¯ ) e - i ⁢ p ⁢ x + ε λ ( p ¯ ) a A ( λ ; p ¯ ) * e i ⁢ p ⁢ x ) | p + = E , comελ⁢(p¯)a os vetores de polarização do campo (λ = + , ⊥, − ). Se eles são escolhidos reais, então a equação anterior se reduz à: (252) A a ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) ⁢ ∑ λ ε λ ⁢ ( p ¯ ) a × ( A ⁢ ( λ ; p ¯ ) ⁢ e - i ⁢ p ⁢ x + A ⁢ ( λ ; p ¯ ) * ⁢ e i ⁢ p ⁢ x ) | p + = E . O caráter vetorial do campo eletromagnético está, então, contido nos vetores de polarização e, portanto, (da mesma forma que acontecia com os espinores de polarização do campo de Dirac) devem carregar também a informação relativa aos vínculos impostos. Ora, como este campo possui somente dois graus de liberdade, também serão só dois os vetores de polarização dinâmicos; diremos que estes são aqueles com λ = 1, 2. As duas condições de gauge explicitadas na equação (237) são obtidas pelo uso dos vetores de polarização: (253) ε 1 ⁢ ( p ¯ ) a = ( 0 ; 1 ; 0 ; - p 1 p - ) , ε 2 ⁢ ( p ¯ ) a = ( 0 ; 0 ; 1 ; - p 2 p - ) , cuja norma é: (254) η a ⁢ b ⁢ ε α ⁢ ( p ¯ ) a ⁢ ε β ⁢ ( p ¯ ) b = - δ β α , o que indica que estão normalizados e são do tipo-espaço. O cálculo direto então mostra que tais vetores de polarização físicos seguem a regra de soma: (255) ∑ λ = 1, 2 ε λ ⁢ ( p ¯ ) a ⁢ ε λ ⁢ ( p ¯ ) b = - η a ⁢ b + p a ⁢ η b + η a ⁢ p b p - - p 2 p - 2 ⁢ η a ⁢ η b . Isto estabelece uma relação importante com o problema de Goursat: Devido à igualdade p2δ(p2) = 0 [62], as equações (83) e (248) implicam que, no espaço dos momentos: (256) D ^ a ⁢ b ⁢ ( p ) = - ∑ λ = 1, 2 ε λ ⁢ ( p ¯ ) a ⁢ ε λ ⁢ ( p ¯ ) b ⁢ D ^ 0 ⁢ ( p ) . Devemos finalmente nos ocupar da definição dos outros dois vetores de polarização, embora eles não se manifestem fisicamente. Como o conjunto dos quatro vetores hão de formar uma base para o espaço-tempo de Minkowski, requeriremos sua ortonormalidade –que é uma extensão da equação (254)–: (257) η a ⁢ b ⁢ ε λ ⁢ ( p ¯ ) a ⁢ ε λ ′ ⁢ ( p ¯ ) b = η λ ⁢ λ ′ , equivalente à relação de completeza: (258) ∑ λ ⁢ λ ′ η λ ⁢ λ ′ ⁢ ε λ ⁢ ( p ¯ ) a ⁢ ε λ ′ ⁢ ( p ¯ ) b = η a ⁢ b . Digamos que sejam (259) ε + ⁢ ( p ¯ ) a = ( a ; b ; c ; d ) , ε - ⁢ ( p ¯ ) a = ( e ; f ; g ; h ) . As condições de serem ε+⁢(p¯)a⁢ε+⁢(p¯)a=0, ε1⁢(p¯)a ε+⁢(p¯)a=0 e ε2⁢(p¯)a⁢ε+⁢(p¯)a=0 levam a que, quer a ≠ 0 e (260) ε + ⁢ ( p ¯ ) a = a ⁢ ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , quer a = 0 e (261) ε + ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; d ) . Analogamente, as condições de serem ε-⁢(p¯)a⁢ε-⁢(p¯)a=0, ε1⁢(p¯)a⁢ε-⁢(p¯)a=0 e ε2⁢(p¯)a⁢ε-⁢(p¯)a=0 implicam que, quer e ≠ 0 e (262) ε - ⁢ ( p ¯ ) a = e ⁢ ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , quer e = 0 e (263) ε - ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; h ) . Evidentemente, somente poderá ser a ≠ 0 e e = 0, ou a = 0 e e ≠ 0, pois de outra forma os vetores serão proporcionais um ao outro. Qual dessas duas possibilidades deve ser usada, é impossível dizê-lo; é matéria de escolha. Escolheremos a primeira. Então a condição de ser ε+⁢(p¯)a⁢ε-⁢(p¯)a=1 implica que: ah = 1, cuja mais simples solução é: a = 1 = h. Os vetores de polarização não-dinâmicos serão portanto: (264) ε + ⁢ ( p ¯ ) a = ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , (265) ε - ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; 1 ) . e 9 9. Campo vetorial massivo Por fim, consideremos o campo vetorial massivo real19 Ba(x), e estabeleçamos para ele a densidade lagrangiana de Proca: (266) ℒ B = - 1 4 ⁢ F a ⁢ b ⁢ F a ⁢ b + m 2 ⁢ B a ⁢ B a , com: (267) F a ⁢ b := ∂ a ⁡ B b - ∂ b ⁡ B a . As equações do movimento do campo são, portanto: (268) ∂ b ⁡ F b ⁢ a + m 2 ⁢ B a = 0 , e o tensor de energia-momento que lhe é associado: (269) Θ = ν μ F ∂ ν σ μ B σ + 1 4 δ ν μ F σ ⁢ τ F σ ⁢ τ - 1 2 δ ν μ m 2 B σ B σ . 9.1. Problema de Goursat Nota-se, contudo, que o tensor Fab é antissimétrico, do que decorre que a aplicação da derivada ∂a à equação (268) leva imediatamente ao cumprimento da condição: (270) ∂ a ⁡ B a ⁢ ( x ) = 0 , cuja substituição na equação (268) implica que as equações do movimento são as equações de Klein-Gordon-Fock de cada uma das componentes: (271) ( □ + m 2 ) ⁢ B a ⁢ ( x ) = 0 . O conjunto das equações (270) e (271) é assim equivalente à equação (268). Em consequência, como tais componentes estão relacionadas pelo vínculo da equação (270), somente três componentes do campo vetorial massivo serão independentes, enquanto que a outra será determinada por eles. Mas a diferença do campo eletromagnético, como a densidade lagrangiana não possui a invariância de calibre, nenhuma outra condição subsidiária pode ser imposta; em particular, a componente B+(x) não pode ser anulada, e o vínculo não é cinemático, pois inclui uma derivada temporal. Assim, o vínculo bem pode ser entendido como uma equação dinâmica para a componente B+(x): (272) ∂ + ⁡ B + ⁢ ( x ) = - ∂ α ⁡ B α ⁢ ( x ) - ∂ - ⁡ B - ⁢ ( x ) . Essa equação não substitui a equação de Klein-Gordon-Fock para a componente B+, pois ela não é identicamente satisfeita, uma vez que Bα, B− verificam a mencionada equação. Em seu lugar, o vínculo torna essa em uma equação não-dinâmica: (273) ( ∂ ⊥ 2 - m 2 ) ⁢ B + ⁢ ( x ) = - 2 ⁢ ∂ - ⁡ ( ∂ α ⁡ B α + ∂ - ⁡ B - ) , cuja solução é única uma vez impostas as condições assintóticas de desvanecimento de B+(x) no infinito das variáveis x⊥. Em particular, é claro que as condições assintóticas tanto nessas direções como na direção da variável x− serão implicadas por aquelas impostas às componentes Bα e B−. Portanto, não é necessário fornecer dados iniciais para a componente B+, que são consequência da equação (273). Com a análise anterior provamos que o número de dados iniciais requeridos é igual a seis: Os valores das componentes Bα e B− nas superfícies características –ou na superfície inicial e condições assintóticas na variável x−–. A solução ao problema de Goursat pode então ser escrita da seguinte forma: (274) B + ⁢ ( x ) = B + ⁢ ( x 0 + ; x ¯ ) - ∫ x 0 + x + d y + ⁢ ( ∂ α ⁡ B α + ∂ - ⁡ B - ) ⁢ ( y + ; x ¯ ) , (275) B α , - ⁢ ( x ) = ∫ y + = x 0 + d 3 ⁢ y ¯ ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ B α , - ⁢ ( y ) , com B+⁢(x0+,x¯) a solução à equação (273) em x+=x0+. Contudo, essa forma da solução tem a desagradável desvantagem de não ser covariante. Por esse motivo, é preferível escrever a solução da seguinte forma: (276) B a ( x ) = ∫ y + = x 0 + d 3 y ¯ D ( x - y ) b a ∂ ↔ - y B b ( y ) , com D(x)ba escolhido de sorte que as equações (270) e (271) sejam satisfeitas. Evidentemente, para isso é suficiente que sejam cumpridas: (□+m2)D(x)ba=0 e ∂aD(x)ba=0, o que é verificado por: (277) D ( x ) b a = ( δ b a + ∂ a ⁡ ∂ b m 2 ) D ( x ) . A forma assim escrita é compatível com o número de dados iniciais requeridos: Embora pareça que precisamos conhecer B+ na superfície inicial para colocá-la no lado direito da equação (276), ela ainda pode ser determinada com o mero conhecimento de Bα e B− em dita superfície, pois as equações (276) e (277) ainda implicam a equação (273). 9.2. Vetores de polarização Como cada componente do campo vetorial massivo satisfaz a equação de Klein-Gordon-Fock, poderemos escrever, já escolhendo os vetores de polarização ελ⁢(p¯)a reais: (278) B a ⁢ ( x ) = ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) ⁢ ∑ λ ε λ ⁢ ( p ¯ ) a × ( B ⁢ ( λ ; p ¯ ) ⁢ e - i ⁢ p ⁢ x + B ⁢ ( λ ; p ¯ ) * ⁢ e i ⁢ p ⁢ x ) | p + = E . Como outrora fizemos para o campo eletromagnético, é mister também agora definir os vetores de polarização com a finalidade de satisfazer aos vínculos impostos. Para satisfazer ao vínculo ∂a⁡Ba(x) = 0 é necessário escolher os três vetores de polarização físicos, que denotaremos εj⁢(p¯)a (j = 1, 2, 3), tais que: (279) p a ⁢ ε j ⁢ ( p ¯ ) a = 0 . Daqui, os vetores de polarização físicos deverão ser da forma: (280) ε j ⁢ ( p ¯ ) a = ( δ b a - p a ⁢ p b m 2 ) ⁢ θ j ⁢ ( p ¯ ) b , com θj⁢(p¯)b vetores linearmente independentes escolhidos de forma que a norma dos vetores de polarização seja igual à unidade. Claramente, desde que o momento pa é do tipo-tempo –por se tratar de um campo massivo–, os vetores de polarização serão do tipo-espaço, e então sua norma, exigiremos, é igual a –1. Escolhemos portanto os três vetores θja na direção dos eixos espaciais20: (281) θ 1 a ∼ ( 0 ; 1 ; 0 ; 0 ) , θ 2 a ∼ ( 0 ; 0 ; 1 ; 0 ) , θ 3 a ∼ ( 1 ; 0 ; 0 ; - 1 ) . Os vetores de polarização normalizados que obtemos são: (282) ε 1 ⁢ ( p ¯ ) a = ( 1 + p 1 2 m 2 ) - 1 × ( - p - ⁢ p 1 m 2 ; 1 + p 1 2 m 2 ; p 2 ⁢ p 1 m 2 ; - p + ⁢ p 1 m 2 ) , (283) ε 2 ⁢ ( p ¯ ) a = ( 1 + p 2 2 m 2 ) - 1 × ( - p - ⁢ p 2 m 2 ; p 1 ⁢ p 2 m 2 ; 1 + p 2 2 m 2 ; - p + ⁢ p 2 m 2 ) , (284) ε 3 ⁢ ( p ¯ ) a = ( 1 + ( p + - p - ) 2 2 ⁢ m 2 ) - 1 × ( 1 2 - p - ⁢ ( p + - p - ) 2 ⁢ m 2 ; p 1 ⁢ ( p + - p - ) 2 ⁢ m 2 ; p 2 ⁢ ( p + - p - ) 2 ⁢ m 2 ; - 1 2 - p + ⁢ ( p + - p - ) 2 ⁢ m 2 ) . Estes três vetores geram o espaço tri-dimensional ortogonal ao momento pa. O vetor de polarização não físico, evidentemente, deverá ser definido ao longo de tal vetor: (285) ε 0 ⁢ ( p ¯ ) a = p a m . A regra de soma para os vetores de polarização físicos é agora: (286) ∑ j = 1 3 ε j ⁢ ( p ¯ ) a ⁢ ε j ⁢ ( p ¯ ) b = - η a ⁢ b + p a ⁢ p b m 2 . Como alhures encontramos para o campo eletromagnético, essa regra de soma está intimamente relacionada com o problema de Goursat: Comparando as equações (277) e (286) vemos que no espaço dos momentos: (287) D ^ a ⁢ b ⁢ ( p ) = - ∑ j = 1 3 ε j ⁢ ( p ¯ ) a ⁢ ε j ⁢ ( p ¯ ) b ⁢ D ^ ⁢ ( p ) . estão dedicadas ao estudo dos campos escalar, fermiônico, eletromagnético e vetorial massivo no plano nulo, respectivamente. Finalmente, na seção 10 10. Discussão e conclusões Apresentamos, detalhadamente, a teoria de campos clássicos livres na dinâmica do plano nulo, surgida como a possibilidade mais conveniente, desde a perspectiva hamiltoniana, dentre as diversas formas dinâmicas relativísticas. Porém, vimos que os planos nulos são precisamente as superfícies características da equação de Klein-Gordon-Fock, constituíndo justamente o único caso em que sua solução é diferente daquela da dinâmica instantânea, pois a hipótese do teorema de Cauchy-Kovalevskaya não se lhe aplica. Contudo, mostramos que esta possibilidade é de fato realizável para os diferentes campos: escalar, fermiônico, eletromagnético e vetorial massivo. Em todos os casos determinamos a solução única dependente apenas dos dados iniciais, que agora devem ser: o valor do campo na superfície inicial x+ = constante e a condição assintótica de desvanecimento do campo no infinito da variável x−. Encontramos também para estes campos o gerador de translações no tempo x+ (hamiltoniano no plano nulo) e fizemos um estudo a respeito de suas componentes dinâmicas e não dinâmicas, relacionadas sempre por equações de vínculo em virtude das quais foram determinados os vetores (ou espinores, no caso fermiônico) de polarização dos campos. Com os procedimentos e resultados expostos temos estabelecido as bases da teoria de campos no plano nulo. A utilidade dela será encontrada, por exemplo, na teoria conforme. Tal estudo, assim como o das interações entre os campos no plano nulo, que apresentará peculiaridades devido à presença de termos «instantâneos», será abordado em um próximo artigo. Igualmente, temos como perspectiva abordar a quantização dos campos no plano nulo que aqui estudamos classicamente, visto que a teoria quântica de campos no plano nulo é uma ferramenta poderosa no estudo da física hadrônica. discutimos os resultados obtidos e apresentamos nossas conclusões.

2. Definição algébrica das formas dinâmicas

Nessa seção introduziremos as diversas formas dinâmicas seguindo as idéias apresentadas por Dirac [6], que colocou o problema da seguinte forma: Duas teorias, a relatividade de Poincaré-Einstein, que exige a invariância da física frente às transformações do grupo de Poincaré, e a mecânica quântica, cuja estrutura é hamiltoniana,4 passaram por importantes provas experimentais. Quais serão as condições gerais que permitem a descrição de um sistema físico compatível com esses dois requerimentos simultâneamente?

Comecemos com a imposição da possibilidade da formulação hamiltoniana. Essa formulação se equivale com o formalismo dos colchetes de Poisson [48, 49], segundo o qual variáveis dinâmicas quaisquer, ξ, η e ζ, devem ter colchetes de Poisson regidos pelas leis:

(1) { ξ ; η } = - { η ; ξ } ,
(2) { ξ ; η + ζ } = { ξ ; η } + { ξ ; ζ } ,
(3) { ξ ; η ζ } = { ξ ; η } ζ + η { ξ ; ζ } ,
(4) { { ξ ; η } ; ζ } + { { η ; ζ } ; ξ } + { { ζ ; ξ } ; η } = 0 .

Mas as variáveis dinâmicas estão definidas em relação ao sistema das coordenadas –exemplo disto são as próprias coordenadas e os momentos–, de forma que aquelas mudam quando essas são submetidas a uma transformação. Sob a transformação infinitesimal das coordenadas, cada variável dinâmica ξ transforma-se segundo:

(5) ξ = ξ + { ξ ; F } ,

com F alguma variável dinâmica infinitesimal, dependente apenas do sistema envolvido e da transformação de coordenadas, e ao que se dá o nome de «gerador da transformação». Essa forma da variação garante que as relações entre os colchetes de Poisson das diversas variáveis dinâmicas permaneçam inalteradas, o que permite cumprir a exigência da teoria da relatividade: «Sob as transformações do grupo de Poincaré, as variações das variáveis dinâmicas devem ser tais que os colchetes de Poisson entre elas permaneçam os mesmos». Assim, se faz necessário examinar os geradores das transformações de Poincaré. Uma transformação infinitesimal de Poincaré muda as coordenadas segundo:

(6) x μ = x μ + a μ + b x ν ν μ ,

com aμ os parâmetros infinitesimais da translação e bμν = − bνμ os parâmetros infinitesimais associados à transformação de Lorentz. Mantendo a discussão em nível infinitesimal, o gerador F deverá também ser linear nestes parâmetros:

(7) F = - P μ a μ + 1 2 M μ ν b μ ν ; M μ ν = - M ν μ .

A dependência com a transformação está inclusa nos parâmetros a e b; logo as variáveis dinâmicas P e M caracterizam o sistema em estudo. Elas se chamam «quantidades fundamentais», e estão sujeitas à álgebra do grupo de Poincaré, como o demonstramos no apêndice A A. Álgebra de Poisson das quantidades fundamentais Demonstraremos nesse apêndice que a álgebra das quantidades fundamentais é a álgebra do grupo de Poincaré. Consideremos primeiramente a ação de duas transformações consecutivas, caracterizadas pelos geradores F1 e F2. A variável dinâmica ξ muda então para –mantendo termos até de ordem F1F2, mas desconsiderando as da ordem F12 e F22–: (288) ξ ″ = ξ + { ξ ; F 1 } + { ξ ; F 2 } + { { ξ ; F 2 } ; F 1 } . Se as transformações forem aplicadas na ordem inversa, isto é, primeiro F2 e depois F1, a variável dinâmica teria se tornado: (289) ξ * * = ξ + { ξ ; F 1 } + { ξ ; F 2 } + { { ξ ; F 1 } ; F 2 } . Dessas equações, a identidade de Jacobi expressa na equação (4) leva a que a diferença entre a aplicação das transformações em uma ordem ou em outra é igual a: (290) ξ * * - ξ ″ = { ξ ; { F 1 ; F 2 } } . Portanto, o comutador das pequenas variações da variável dinâmica se relaciona com o colchete de Poisson dos geradores das transformações correspondentes. Assim é que poderemos estabelecer a álgebra de colchetes de Poisson entre os geradores P e M das transformações de Poincaré, uma vez que conhecemos a ação deles nas coordenadas. Comecemos por ver que, segundo as equações (5), (6) e (7): (291) a μ + b μ ⁢ ν ⁢ x ν = - a ρ ⁢ { x μ ; P ρ } + 1 2 ⁢ b ρ ⁢ σ ⁢ { x μ ; M ρ ⁢ σ } , cuja solução é: (292) { x μ ; P ρ } = - δ ρ μ , { x μ ; M ρ ⁢ σ } = δ ρ μ ⁢ x σ - δ σ μ ⁢ x ρ . Definamos agora os geradores: F 1 = - P μ ⁢ a μ + 1 2 ⁢ M μ ⁢ ν ⁢ b μ ⁢ ν , F 2 = - P ρ ⁢ a ′ ⁣ ρ + 1 2 ⁢ M ρ ⁢ σ ⁢ b ′ ⁣ ρ ⁢ σ , cujo comutador é: (293) { F 1 ; F 2 } = a μ a ρ { P μ ; P ρ } - 1 2 a μ b ′ ⁣ ρ ⁢ σ { P μ ; M ρ ⁢ σ } - 1 2 ⁢ a ′ ⁣ ρ ⁢ b μ ⁢ ν ⁢ { M μ ⁢ ν ; P ρ } + 1 4 ⁢ b μ ⁢ ν ⁢ b ′ ⁣ ρ ⁢ σ ⁢ { M μ ⁢ ν ; M ρ ⁢ σ } . Por outro lado, as transformações de coordenadas correspondentes, aplicadas sucessivamente, levam, via a equação (6), a: x ″ ⁣ τ = x τ + ( a ′ ⁣ τ + a τ + b ′ ⁣ τ ⁢ η ⁢ a η ) + ( b τ ⁢ λ + b ′ ⁣ τ ⁢ λ + b ′ ⁢ b η ⁢ λ η τ ) ⁢ x λ , x * ⁣ * τ = x τ + ( a τ + a ′ ⁣ τ + b τ ⁢ η ⁢ a η ′ ) + ( b ′ ⁣ τ ⁢ λ + b τ ⁢ λ + b ⁢ b ′ ⁣ η ⁢ λ η τ ) ⁢ x λ , e obtemos: (294) x * ⁣ * τ - x ″ ⁣ τ = b τ ⁢ η ⁢ a η ′ - b ′ ⁣ τ ⁢ η ⁢ a η + ( b ⁢ b ′ ⁣ η ⁢ λ η τ - b ′ ⁢ b η ⁢ λ η τ ) ⁢ x λ . O lado direito dessa equação, tal como o ditam as equações (290) e (293), deverá igualarse a: (295) a μ ⁢ a ρ ⁢ { x τ ; { P μ ; P ρ } } - 1 2 ⁢ a μ ⁢ b ′ ⁣ ρ ⁢ σ ⁢ { x τ ; { P μ ; M ρ ⁢ σ } } - 1 2 ⁢ a ′ ⁣ ρ ⁢ b μ ⁢ ν ⁢ { x τ ; { M μ ⁢ ν ; P ρ } } + 1 4 ⁢ b μ ⁢ ν ⁢ b ′ ⁣ ρ ⁢ σ ⁢ { x τ ; { M μ ⁢ ν ; M ρ ⁢ σ } } . E dessa igualdade, por meio da equação (292), obtém-se a álgebra de colchetes de Poisson dos geradores das transformações de Poincaré contida nas equações (8)–(10). :

(8) { P μ ; P ν } = 0 ,
(9) { M μ ν ; P ρ } = - g μ ρ P ν + g ν ρ P μ ,
(10) { M μ ν ; M ρ σ } = - g μ ρ M ν σ + g ν ρ M μ σ - g μ σ M ρ ν + g ν σ M ρ μ .

Neste ponto, Dirac introduz a noção do que sejam as formas dinâmicas: Elas são as soluções para as relações algébricas que acabamos de escrever. Para entender o que isto quer dizer, lembre o leitor que nem todas as transformações do grupo de simetrias do espaço-tempo levam à evolução dinâmica das superfícies isocrônicas; na teoria newtoniana, por exemplo, em que o grupo de simetrias é o grupo de Galilei, uma translação espacial ou uma rotação não muda a superfície de tempo constante, apenas a transforma em si mesma, são «transformações cinemáticas» e a superfície isocrônica é estável em relação a elas. O mesmo ocorre na teoria relativística: Alguns dos geradores darão lugar a transformações cinemáticas e constituirão o «grupo de estabilidade» das superfícies isocrônicas, mapeando estas em si mesmas; os outros geradores levam a transformações que mudam a superfície, a fazem evoluir, e assim devem ser identificados com as transformações dinâmicas; a estes geradores Dirac dá o nome de «hamiltonianos».

A partir daqui, já é evidente que o grupo de estabilidade e os hamiltonianos dependerão de qual seja a superfície isocrônica escolhida, e daí o interesse nas diversas formas dinâmicas: Pode acontecer –como de fato acontece, segundo comentamos na seção 1 1. Introdução Quando se diz da descrição física de um determinado fenômeno ao que se quer indicar é ao conhecimento da evolução das grandezas observáveis que o determinam. Essas grandezas mudam segundo a dinâmica particular do fenômeno e, assim, é necessário referi-las a algum parâmetro ao que chamamos «tempo». Na nossa concepção popular, que tem lugar no espaço-tempo absoluto de Newton, o tempo é um conceito primitivo assim como o é o espaço. Disto não temos dúvida porque nessa descrição a cada tempo só pode corresponder um único valor dos observáveis, uma vez que em cada instante a partícula somente pode se encontrar em um único ponto e não em outro. Tal segurança, no entanto, é substituída pela dúvida uma vez que nos defrontamos com os conceitos da teoria da relatividade de Poincaré-Einstein [1, 2, 3, 4]. Esta é a teoria do espaço-tempo em que todos os sistemas inerciais de referência se equivalem, formulada de forma compatível com o fato experimentalmente provado da constância da velocidade da luz no vácuo. Ela impõe um limite às velocidades das partículas, restringe seu movimento e, em correspondência, levanta a possibilidade da foliação do espaço-tempo por superfícies diferentes daquela que usávamos na teoria newtoniana: Compensa, por assim dizer, a restrição do movimento incrementando as possibilidades de sua descrição. O aparecimento de novas possibilidades para descrever a dinâmica o podemos entender fácilmente no contexto da mecânica do ponto, em que todas as grandezas físicas associadas a ele estão concentradas no próprio ponto e ele, então, descreve uma trajetória de evolução que é uma «linha de mundo». Em semelhante situação, a restrição que permite a completa descrição do sistema é que a mencionada linha de mundo só possa atravessar a superfície isocrônica uma única vez. Veremos a seguir quais são as superfícies que possuem esta característica. Na dinâmica newtoniana a partícula pode ter velocidade qualquer. Assim sendo, num diagrama tversusx, a linha de mundo da partícula pode adotar coeficiente angular (inclinação) não-negativa qualquer.1 Portanto, é possível que uma partícula atravesse uma superfície inclinada no espaço t − x mais de uma vez, caso for acelerada suficientemente, como temos desenhado na figura 1(b), e isto acontecerá sem importar quão pequena seja a inclinação do plano. Em semelhante situação, a partícula poderia ser encontrada em mais de um ponto em cada tempo, e sua descrição se tornaria impossível. Concluindo, na dinâmica newtoniana a única forma dinâmica possível é a «dinâmica instantânea», na qual as superfícies isocrônicas são superfícies de tempo (newtoniano) constante, como mostrado na figura 1(a). Figura 1 (a) Superfície de tempo constante. (b) Superfície inclinada. Na dinâmica relativística não enfrentamos o problema de velocidades infinitas que limitava as possíveis descrições no caso não-relativístico. Com efeito, agora a linha de mundo das partículas está restrita pela causalidade a estar sempre dentro do cone de luz, em cada ponto dela; ou seja, num diagrama t − x, o coeficiente angular da linha de mundo, em cada ponto, não pode ser menor do que a unidade – ou menor do que 1/c, onde c é a velocidade da luz no espaço vazio–. Quem primeiro se perguntou pela possibilidade de escolha das superfícies isocrônicas nessa situação foi Dirac em 1949 [6]; mais adiante detalharemos seus raciocínios. Ele conseguiu encontrar três formas dinâmicas relativísticas, a saber: (a) Dinâmica instantânea: Aquela em que as superfícies redisocrônicas são superfícies de coordenada x0 constante, essa coordenada sendo o tempo. Esta é a mesma forma da dinâmica newtoniana, a mais amplamente usada. Ela se mostra na figura 2(a). Figura 2 (a) Dinâmica instantânea. (b) Dinâmica forma-ponto. (c) Dinâmica da frente de luz. (b) Dinâmica forma-ponto: Nessa forma dinâmica, que se mostra na figura 2(b), as superfícies isocrônicas são os ramos superiores dos hiperboloides a2 = x2, o parâmetro a2 sendo o tempo da teoria. Nota-se que no caso limite a2 = 0, os hiperboloides degeneram no cone de luz. (c) Dinâmica da frente de luz:2 Aqui as superfícies isocrônicas são planos nulos de coordenada x+ ∼ x0 + x3 constante, sendo ela o tempo da teoria, como se mostra na figura 2(c). Tal como temos apresentado, à pergunta de Dirac temos dado, como ele mesmo o fez, uma resposta intuitiva: Não temos usado um método para encontrar essas formas dinâmicas e não sabemos se elas são as únicas ou se existem outras, nem abordamos tampouco o problema de sua equivalência, de suas possibilidades e limitações. Mas já podemos perceber que a transição da multiplicidade de escolhas na dinâmica relativística à unicidade da newtoniana seria assim: O limite não-relativístico das novas formas dinâmicas é a dinâmica instantânea, pois as superfícies isocrônicas, quer os hiperboloides, quer os frentes de luz, se aproximam das superficies de x0 constante no limite c → + ∞, visto que o próprio cone de luz se abre infinitamente, fazendo os hiperboloides perderem sua curvatura na dinâmica forma-ponto e os planos nulos perderem sua inclinação na dinâmica da frente de luz; por isto, o limite não-relativístico não constitui um motivo de preferência da dinâmica instantânea sobre as outras formas dinâmicas: No mundo não-relativístico é impossível diferenciar uma da outra; a finitude de c não «faz aparecer» novas formas dinâmicas, mas levanta a degenerescência entre elas. Após o trabalho de Dirac, as formas dinâmicas por ele descobertas foram muito pouco estudadas. Mas vários anos depois, na segunda metade da década de 1960, a forma dinâmica da frente de luz reapareceu de forma totalmente independente –e com nomes diferentes como já veremos– como um método a ser usado na solução de dois problemas. Apareceu primeiramente em 1965 no trabalho de Fubini e Furlan [17] em álgebra de correntes, sob o nome de «sistema de referência de momento infinito», pois a ele tinham chegado por um processo de limite de um sistema de referência se movimentando com velocidade próxima à da luz. Este trabalho iniciou uma linha de pesquisa à qual se aderiram, por exemplo, Weinberg [18] e Bebié e Leutwyler [19]. O outro problema em que essa forma dinâmica se mostrou vantajosa foi no estudo do campo do laser; isto ocorreu em 1967 durante os estudos de doutorado de Neville sob a orientação de Rohrlich [15, 20, 21]. Nesses dois problemas, insistimos, a dinâmica da frente de luz foi usada como uma ferramenta para a fenomenologia, sem referência nenhuma ao artigo de Dirac. Mas a conexão entre estes trabalhos não tardou em ser reconhecida: Chang e Ma [22], em 1969, publicaram um artigo em que se estudava o modelo de interação φ3, assim como a eletrodinâmica quântica (QED) nas novas variáveis da frente de luz; nele foi dito pela primeira vez que o sistema de referência de momento infinito correspondia-se com a forma dinâmica da frente de luz de Dirac. Por outro lado, em 1970 Kogut e Soper [23] interpretaram o passo ao sistema de referência de momento infinito como uma mudança de variáveis equivalente à formulação no plano nulo de Rohrlich e Neville. Dessarte, podemos afirmar que a dinâmica da frente de luz foi descoberta três vezes de forma independente: Primeiro em 1949 por Dirac, em 1965 por Fubini e Furlan, e em 1967 por Neville e Rohrlich, e que elas foram identificadas como uma e a mesma nos trabalhos de Chang e Ma e de Kogut e Soper. A partir desse ponto a física no plano nulo começou a ser mais estudada: O problema dos valores iniciais para os campos clássicos foi estudado por Rohrlich e Neville [15, 24], que estabeleceram teoremas de existência e unicidade das soluções para o campo escalar de Klein-Gordon-Fock, para o campo de Dirac e para o campo eletromagnético sujeito à condição de gauge do plano nulo A+ = 0, aduzindo importantes razões para seu uso. O plano nulo encontrou importante aplicação desde seu nascimento na teoria ondulatória (quântica), em que destacam, entre outros, o trabalho de Leutwyler, Klauder e Streit [25] sobre questões teóricas da quantização, o de Ten Eyck e Rohrlich [26, 27] e Chang, Root e Yan [28, 29, 30, 31] sobre a equivalência da QED no plano nulo com a QED na forma instantânea, o trabalho sobre renormalização da QED por Brodsky, Roskies e Suaya [32] e na área mais fenomenológica o uso que a ela deram Drell, Levy e Yan [33, 34, 35, 36] no modelo a pártons. Com o renascimento do estudo das formas dinâmicas impulsionado pela física no plano nulo advieram igualmente trabalhos de pesquisa na forma dinâmica da forma-ponto –uma revisão pode ser encontrada na Ref. [37]–. Em 1978, as três soluções encontradas por Dirac foram complementadas por importantes pesquisadores na área da física no plano nulo. Para tal foi usado o método exposto por Dirac no artigo original, que foi definir as superfícies isocrônicas em relação ao subgrupo do grupo de Poincaré que as deixa invariantes –chamado «grupo de estabilidade» da superfície–; embora Dirac tenha estabelecido suas soluções «à mão», na década de 1970 havia sido feita uma classificação dos subgrupos do grupo de Poincaré [9, 10, 11, 12], o que possibilitou fazer rigoroso o método de Dirac; Leutwyler e Stern [13] encontraram mais duas formas dinâmicas, cujas superfícies isocrônicas são definidas como (d) os ramos superiores dos hiperbolóides de equação (x0)2 − (x1)2 − (x2)2 = a2, e (e) os dos hiperbolóides que seguem a lei (x0)2 − (x3)2 = a2; em ambos os casos, semelhantemente à forma-ponto, ao parâmetro a2 é dada a função de tempo. Leutwyler e Stern mostraram ainda que as cinco formas dinâmicas agora conhecidas são as únicas possíveis que satisfazem a imposição da transitividade do grupo de estabilidade das superfícies isocrônicas, isto é, que todo ponto da superfície pode ser conectado com qualquer outro ponto nela por algum elemento do grupo de estabilidade. Essas novas formas dinâmicas, também, degeneram na dinâmica instantânea no limite não-relativístico. É claro que todas essas formas dinâmicas requerem atenção e estudo, embora os autores não conheçam o trabalho realizado em alguma das duas novas formas dinâmicas adicionadas por Leutwyler e Stern. Quanto à dinâmica da frente de luz, ela possui as seguintes peculiaridades que mostraremos mais adiante: Dirac [6] mostrou que nessa forma dinâmica o número de geradores do grupo de Poincaré independentes da interação é máximo; também, os planos nulos são as superfícies características da equação diferencial de Klein-Gordon-Fock [14, 15], equação a que todo campo deve satisfazer. Essas propriedades se oferecem à vista já na teoria clássica que é motivo do presente estudo. A esse âmbito clássico pertence também o estudo realizado por Casana, Pimentel e Zambrano [7, 8, 38] em que a estrutura de vínculos da eletrodinâmica fermiônica e a escalar, sujeitas à condição de gauge do plano nulo, é estudada na dinâmica da frente de luz usando a técnica de Dirac-Bergmann. As aplicações mais importantes da dinâmica da frente de luz encontram-se na física hadrônica, particularmente, para a descrição de estados compostos devido à trivialidade do seu estado de vácuo na teoria quântica [13, 16]. Nesse sentido, uma técnica comumente usada é a chamada «quantização discreta no cone de luz», concebida por Maskawa e Yamawaki [39] por motivos teóricos,3 e usada na aplicação por Pauli e Brodsky [40, 41]. As teorias de gauge não-abelianas sob a condição de gauge do plano nulo foram estudadas por Tomboulis [42] na ausência de matéria e por Casher [43] em presença de férmions. Pimentel, Suzuki e Zambrano, na Ref. [44], estudaram também a estrutura de vínculos dessas teorias usando o método de integração funcional. Uma revisão dos avanços feitos na cromodinâmica quântica (QCD) no plano nulo em relação à física hadrônica pode ser encontrada na Ref. [45]. Contudo, há pontos na teoria do campo no plano nulo que se encontram ainda em discussão. A equivalência com a dinâmica instantânea, por exemplo, é ainda tema de debate, como é mostrado, por exemplo, na Ref. [46]. O mesmo acontece com os «termos instantâneos» que aparecem nos propagadores dos campos de Dirac e eletromagnético –vide, por exemplo, a Ref. [47]–. O presente artigo é constituído da seguinte forma. Na seção 2 expomos as ideias que levaram Dirac a estabelecer o problema das formas dinâmicas e a solução que a ele foi dado. Essa definição puramente algébrica é levada ao âmbito da teoria do campo clássico na seção 3. Os elementos básicos para a descrição do plano nulo são apresentados na seção 4. Na seção 5 apresentamos um breve resumo da teoria clássica do campo em forma covariante. Já as seções 6, 7, 8 e 9 estão dedicadas ao estudo dos campos escalar, fermiônico, eletromagnético e vetorial massivo no plano nulo, respectivamente. Finalmente, na seção 10 discutimos os resultados obtidos e apresentamos nossas conclusões. – que para alguns problemas a descrição da dinâmica seja simplificada em uma determinada forma dinâmica, pois os hamiltonianos podem ser mais simples ou mais complicados segundo a escolha da superfície isocrônica. Se tais grupos de estabilidade não são isomórficos, então as formas dinâmicas que lhes correspondem não poderão ser deformadas uma na outra por uma simples transformação de Poincaré; em tais situações, que são precisamente as que definem formas dinâmicas «diferentes», a equivalência física da descrição não se deriva do axioma da relatividade: Esse é o problema da equivalência.

Para relacionar as superfícies isocrônicas com seu grupo de estabilidade, as descreveremos por meio de uma função Σ = Σ(x) cujo valor é constante nas superfícies, ou seja, ele é a expressão do «tempo» da forma dinâmica. Os geradores do grupo de estabilidade serão aqueles que satisfaçam:

(11) { Σ ( x ) ; F } = 0 ,

pois assim sendo, segundo a equação (5), a transformação gerada por F deixa invariante o valor do tempo Σ. Os geradores que não satisfazem à equação (11), por outra parte, serão os geradores da dinâmica. O colchete da equação (11) pode ser calculado uma vez que seja conhecida a função Σ(x) pelo uso das equações (292).

Forma instantânea. Nessa forma dinâmica as superfícies isocrônicas são aquelas em que a coordenada x0 se mantém constante:

(12) Σ ( x ) = x 0 .

Usando as equações (292) vemos que:

(13) { x 0 ; P ρ } = - δ ρ 0 , { x 0 ; M ρ σ } = δ ρ 0 x σ - δ σ 0 x ρ .

O grupo de estabilidade dessas superfícies espaciais contém, como na física newtoniana, as translações e rotações espaciais, correspondentes aos geradores P1, P2, P3, M12, M23 e M31, que são, então, os geradores cinemáticos da forma instantânea. Que eles constituem uma sub-álgebra do grupo de Poincaré –e então dão origem a um de seus subgrupos– pode ser diretamente verificado com o uso das equações (8)–(10): Todos os colchetes de Poisson desses geradores têm por resultado uma expressão que contém a eles mesmos só. Os outros geradores, a saber, P0, M10, M20 e M30, são os geradores dinâmicos ou hamiltonianos. Assim, o grupo de estabilidade da forma instantânea tem dimensão sêis, e possui quatro hamiltonianos.

Forma-ponto. Na forma-ponto o tempo é dado pela função:

(14) Σ ( x ) = x μ x μ .

Calculando a ação dos geradores das transformações de Poincaré sobre ela:

(15) { x μ x μ ; P ρ } = - 2 x ρ , { x μ x μ ; M ρ σ } = 0 .

Portanto, o grupo de estabilidade é constituído pelas transformações geradas por Mμν e tem dimensão seis, ao passo que os geradores Pμ serão os quatro hamiltonianos da forma dinâmica. Embora sejam em número igual que na forma instantânea, a forma-ponto possui a vantagem de apresentar hamiltonianos que compõem um tetra-vetor, podendo ser tratados como uma única entidade covariante. A nomeação de «forma-ponto» dada a essa dinâmica é devida à seguinte propriedade: Que seu grupo de estabilidade é o grupo de rotações tetra-dimensionais ao redor de um ponto fixo.

Forma da frente de luz. Nesta forma dinâmica a superfície isocrônica é a superfície de valor constante do tempo

(16) Σ ( x ) = x + = 1 2 ( x 0 + x 3 ) .

Para ela obtemos que:

(17) { x + ; P ρ } = - δ ρ + , { x + ; M ρ σ } = δ ρ + x σ - δ σ + x ρ .

Ocorre aqui algo curioso: Somente se a superfície for a x+ = 0, o colchete de Poisson {x+; M+ −} se anula, como se observa da equação (17). M+ −, portanto, forma parte do grupo de estabilidade da superfície x+ = 0, mas não das superfícies correspondentes a outros tempos. Restringindo nossa atenção a essa superfície particular, que sempre pode ser usada como a superfície inicial no problema de valores iniciais, teremos que o grupo de estabilidade tem dimensão sete e é formada pelos geradores P1, P2, P, M12, M1 − , M2 − e M+ −. O número de hamiltonianos é três, e são P+, M1 + e M2 + .

Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler e Stern a superfície isocrônica é definida pelo tempo:

(18) Σ ( x ) = ( x 0 ) 2 - ( x 1 ) 2 - ( x 2 ) 2 = x μ x μ + ( x 3 ) 2 .

A ação dos geradores do grupo de Poincaré sobre ela é:

(19) { x μ x μ + ( x 3 ) 2 ; P ρ } = - 2 x ρ - 2 x 3 δ ρ 3 , { x μ x μ + ( x 3 ) 2 ; M ρ σ } = 2 x 3 ( δ ρ 3 x σ - δ σ 3 x ρ ) .

Vemos assim que o grupo de estabilidade tem apenas dimensão quatro, e a ele correspondem os geradores P3, M01, M02 e M12. Os hamiltonianos dessa forma dinâmica são seis: P0, P1, P2, M03, M13 e M23.

Forma de Leutwyler-Stern 2. A segunda forma introduzida por Leutwyler e Stern possui o tempo definido segundo a função:

(20) Σ ( x ) = ( x 0 ) 2 - ( x 3 ) 2 .

Com o uso das equações (292) obtemos que:

(21) { ( x 0 ) 2 - ( x 3 ) 2 ; P ρ } = - 2 x 0 δ ρ 0 + 2 x 3 δ ρ 3 , { ( x 0 ) 2 - ( x 3 ) 2 ; M ρ σ } = 2 x 0 ( δ ρ 0 x σ - δ σ 0 x ρ ) - 2 x 3 ( δ ρ 3 x σ - δ σ 3 x ρ ) .

Com esses resultados podemos estabelecer que o grupo de estabilidade das superfícies de Σ constante é aquele correspondente aos geradores P1, P2, M12 e M03, e portanto tem dimensão quatro. Os seis hamiltonianos dessa forma dinâmica serão os geradores P0, P3, M01, M02, M13 e M23.

E isso esgota as possibilidades, uma vez que não há outro subgrupo do grupo de Poincaré com a propriedade da transitividade que possa servir como grupo de estabilidade de alguma outra superfície [9, 10, 11, 12, 13]. Os resultados que assim obtivemos da classificação algébrica das cinco possíveis formas dinâmicas na teoria relativística se resumem na tabela 1. Como podemos ver, a dinâmica da frente de luz ocupa um lugar destacado por ser a forma dinâmica com o maior grupo de estabilidade e, consequentemente, aquele com o menor número de hamiltonianos.

Tabela 1
Resumo das cinco formas dinâmicas da teoria relativística. D(GΣ): Dimensão do grupo de estabilidade GΣ; N. de H’s: Número de hamiltonianos.

2.1. Mecânica do ponto material

Uma primeira solução, a mais simples, às equações (8)–(10) é obtida na mecânica do ponto material:

(22) P μ = p μ , M μ ν = q μ p ν - q ν p μ ,

com as coordenadas qμ e momentos pμ da partícula sujeitos a:

(23) { q μ ; q ν } = 0 , { p μ ; p ν } = 0 , { p μ ; q ν } = g μ ν .

Desejamos em cada forma dinâmica escrever expressões para esses geradores sobre a superfície inicial (isocrônica). Para isto será necessário incorporar as equações que determinam tal superfície como equações subsidiárias, do tipo:

(24) A 0 .

Mas as condições subsidiárias devem permanecer tais frente a qualquer mudança do sistema de coordenadas, o que implica que devam também ser condições subsidiárias:

(25) { A ; P ρ } 0 , { A ; M ρ σ } 0 .

Para eliminar as variáveis cujo significado é perdido ao fixar a superfície inicial, usaremos a condição de camada de massa, p2m2 = 0, mas a introduziremos nos geradores do grupo de Poincaré usando coeficientes indeterminados (multiplicadores de Lagrange); as equações (22) serão substituídas por:

(26) P μ = p μ + λ μ ( p 2 - m 2 ) ,
(27) M μ ν = q μ p ν - q ν p μ + λ μ ν ( p 2 - m 2 ) ,

com λμν = − λνμ. Tais coeficientes serão determinados pela imposição da equação (25).

Forma instantânea. Temos a condição subsidiária:

(28) q 0 0 .

A anulação do seu colchete de Poisson com o gerador Pμ somente acontece se:

(29) { q 0 ; P σ } = - δ σ 0 - 2 λ σ p 0 0 ,

enquanto a equação correspondente às transformações de Lorentz é:

(30) { q 0 ; M ρ σ } = - q ρ δ σ 0 + q σ δ ρ 0 - λ ρ σ 2 p 0 0 .

Das equações (29) e (30) decorrem os valores:

(31) λ 0 = - 1 2 p 0 , λ r = 0 , λ r 0 = - q r 2 p 0 , λ r s = 0 ,

r, s = 1, 2, 3. Os geradores na superfície inicial são portanto:

(32) P 0 = p 2 + m 2 , P r = p r ,
(33) M r 0 = q r p 2 + m 2 , M r s = q r p s - q s p r .

Temos usado aqui a notação p2=p12+p22+p32.

Forma-ponto. A condição subsidiária nessa forma dinâmica é:

(34) q μ q μ κ 2 = constante .

Essa constante em geral será não nula; porém, ela pode também ser nula, caso em que o hiperboloide degenera no cone de luz. As condições da equação (25) são assim:

(35) { q μ q μ ; P ρ } = - 2 q ρ - 4 λ ρ q p 0 ,
(36) { q μ q μ ; M ρ σ } = - 4 λ μ ν q p 0 .

Dessas equações, obtemos o valor dos coeficientes indeterminados:

(37) λ ρ = - q ρ 2 q p , λ μ ν = 0 ,

e assim também o dos geradores do grupo de Poincaré:

(38) P μ = p μ - q μ ( p 2 - m 2 ) 2 q p ,
(39) M μ ν = q μ p ν - q ν p μ .

Forma da frente de luz. A condição subsidiária consiste, dessa vez, na especificação do plano nulo inicial:

(40) q + 0 .

Agora temos as restrições:

(41) { q + ; P ρ } = - δ ρ + - 2 λ ρ p - 0 ,
(42) { q + ; M ρ σ } = δ ρ + q σ - δ σ + q ρ - 2 λ ρ σ p - 0 .

Delas obtemos os multiplicadores –usamos i, j = 1, 2–:

(43) λ + = - 1 2 p - , λ i = 0 = λ - , λ + - = 0 , λ i + = - q i 2 p - , λ i j = 0 , λ i - = 0 .

E, daqui, os geradores do grupo de Poincaré no plano nulo x+ = 0 são:

(44) P + = p 2 + m 2 2 p - , P - = p - , P i = p i ,
(45) M i + = q i p 2 + m 2 2 p - - q + p i , M + - = q + p - , M 12 = q 1 p 2 - q 2 p 1 , M i - = q i p - .

Nestas expressões: p2=p12+p22.

Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler-Stern a condição subsidiária imposta às coordenadas da partícula é:

(46) q μ q μ + ( q 3 ) 2 κ 2 = constante .

Encontramos as seguintes condições adicionais:

(47) { q μ q μ + ( q 3 ) 2 ; P ρ } = - 2 q ρ - 2 q 3 δ ρ 3 - 4 λ ρ ( q μ p μ + q 3 p 3 ) 0 ,
(48) { q μ q μ + ( q 3 ) 2 ; M ρ σ } 2 q 3 ( δ ρ 3 q σ - δ σ 3 q ρ ) - 4 λ μ ν ( q μ p μ + q 3 p 3 ) 0 ,

das quais podemos isolar os coeficientes indeterminados:

λ 0,1,2 = - q 0,1,2 2 ( q μ p μ + q 3 p 3 ) , λ 3 = 0 , λ 01 = λ 02 = λ 12 = 0 , λ ( 0,1,2 ) 3 = - q 0,1,2 q 3 2 ( q μ p μ + q 3 p 3 ) .

As quantidades fundamentais nesta forma dinâmica são portanto:

(49) P 0,1,2 = p 0,1,2 - q 0,1,2 ( p 2 - m 2 ) 2 ( q μ p μ + q 3 p 3 ) , P 3 = p 3 , M 01 = q 0 p 1 - q 1 p 0 , M 02 = q 0 p 2 - q 2 p 0 , M 12 = q 1 p 2 - q 2 p 1 ,
(50) M ( 0,1,2 ) 3 = q 0,1,2 p 3 - q 3 p 0,1,2 - q 0,1,2 q 3 ( p 2 - m 2 ) 2 ( q μ p μ + q 3 p 3 ) .

Forma de Leutwyler-Stern 2. Nesta última forma dinâmica a condição subsidiária adota a forma:

(51) ( q 0 ) 2 - ( q 3 ) 2 κ 2 = constante .

As condições que tal restrição implica são as que seguem:

(52) { ( q 0 ) 2 - ( q 3 ) 2 ; P ρ } = - 2 q 0 δ ρ 0 + 2 q 3 δ ρ 3 - 4 λ ρ ( q 0 p 0 - q 3 p 3 ) 0 ,
(53) { ( q 0 ) 2 - ( q 3 ) 2 ; M ρ σ } = 2 q 0 ( δ ρ 0 q σ - δ σ 0 q ρ ) - 2 q 3 ( δ ρ 3 q σ - δ σ 3 q ρ ) - 4 λ ρ σ ( q 0 p 0 - q 3 p 3 ) 0 .

Desse sistema, obtemos os valores dos multiplicadores de Lagrange:

λ 0 = - q 0 2 ( q 0 p 0 - q 3 p 3 ) , λ 1, 2 = 0 , λ 3 = q 3 2 ( q 0 p 0 - q 3 p 3 ) , λ 0 ( 1, 2 ) = q 0 q 1, 2 2 ( q 0 p 0 - q 3 p 3 ) , λ 03 = 0 , λ 12 = 0 , λ ( 1, 2 ) 3 = q 3 q 1, 2 2 ( q 0 p 0 - q 3 p 3 ) .

Os geradores ficam da seguinte forma:

(54) P 0 = p 0 - q 0 ( p 2 - m 2 ) 2 ( q 0 p 0 - q 3 p 3 ) , P 1, 2 = p 1, 2 , P 3 = p 3 + q 3 ( p 2 - m 2 ) 2 ( q 0 p 0 - q 3 p 3 ) ,
(55) M 0 ( 1, 2 ) = q 0 p 1, 2 - q 1, 2 p 0 + q 0 q 1, 2 ( p 2 - m 2 ) 2 ( q 0 p 0 - q 3 p 3 ) , M 03 = q 0 p 3 - q 3 p 0 , M 12 = q 1 p 2 - q 2 p 1 , M ( 1, 2 ) 3 = q 1, 2 p 3 - q 3 p 1, 2 + q 3 q 1, 2 ( p 2 - m 2 ) 2 ( q 0 p 0 - q 3 p 3 ) .

Como podemos observar, em todas as formas dinâmicas os geradores do grupo de estabilidade da superfície inicial não são modificados pela restrição a ela, mas somente os hamiltonianos o são, em correspondência com a sua ação. Poderemos nos perguntar agora, nesta situação que é ainda a mais simples possível, que é a do ponto material livre, qual é a forma dinâmica que se apresenta mais vantajosa? Olhando para as expressões que acabamos de escrever para os hamiltonianos, é claro que as formas de Leutwyler-Stern não o serão, não já somente pela complexidade de seus hamiltonianos, mas também pelo fato de serem seis deles. A forma instantânea, muito usada, apresenta a dificuldade de uma raíz quadrada; em relação a este ponto, lembre o leitor a impossibilidade de escrever a equação de Klein-Gordon-Fock na forma hamiltoniana na classe dos operadores diferenciais; isto último somente é possível ao ampliar dita classe e considerar os operadores pseudo-diferenciais –o leitor interessado pode consultar a Ref. [50]–. Semelhante dificuldade é evitada na forma-ponto e na forma da frente de luz, que se mostram assim muito convenientes.

Já indicamos anteriormente uma vantagem importante da forma-ponto, que é o fato de seus hamiltonianos constituirem um tetra-vetor: A covariância é fácilmente implementada nessa forma dinâmica. No entanto, na expressão de seus hamiltonianos aparece sempre o produto qp no denominador, o que faz com que eles sejam complicados. Comparativamente, na forma do plano nulo, além de ser aquela em que o número de hamiltonianos é menor, eles têm também uma forma bastante simples; e em adição seu hamiltoniano P+, associado à energia, depende única e exclusivamente dos momentos, a posição não aparece nele, diferentemente da forma-ponto. Convencidos por estes motivos do interesse da forma dinâmica da frente de luz, passaremos a considerar já não a mecânica do ponto, mas os campos clássicos construidos nela.

3. Forma dinâmica do plano nulo e campos clássicos

A discussão que acabamos de fazer a respeito da possibilidade de definir novas formas dinâmicas tem sido baseada na álgebra do grupo de Poincaré e exemplificada na mecânica do ponto material. E para tal, foi suficiente exigir a descrição unívoca de sua linha de mundo. No entanto, na teoria de campos isto não é suficiente, e devemos nos ocupar também da unicidade da descrição da evolução do campo, isto é, do problema de valores iniciais para as diferentes equações do campo. Com efeito: A estrutura causal da teoria da relatividade implica que o valor adotado pelo campo em cada ponto do espaço-tempo depende dos valores que ele tem adotado no cone de luz passado correspondente a tal ponto; donde a inicialização dos valores do campo em uma superfície isocrônica requer conhecer os valores do campo na interseção do referido cone de luz passado e a superfície inicial. Isto é mostrado para as três formas dinâmicas de Dirac na figura 3. Mas logo percebemos uma dificuldade na forma dinâmica do plano nulo: Enquanto que a interseção é uma região finita na forma instantânea e na forma-ponto, ela é uma região infinita na forma do plano nulo. Sendo assim, o problema dos valores iniciais no plano nulo não poderá ser abordado como uma simples transformação do problema de Cauchy, mas precisa ser estudado independentemente. Eis o objetivo da presente seção.

Figura 3
Problema dos valores iniciais: (a) Na dinâmica instantânea, (b) na dinâmica forma-ponto, (c) na dinâmica da frente de luz.

Na teoria relativística, a invariância sob translações implica que a equação que governa todas as componentes u(x) de todos os campos é a equação de Klein-Gordon-Fock:

(56) ( + m 2 ) u ( x ) = 0 .

Qualquer relação adicional entre as diferentes componentes de um mesmo campo constitui uma relação de vínculo, mas ela não impede o cumprimento da equação (56) –um caso especial, que pareceria contradizer o dito e que contudo não o faz, é o do campo eletromagnético, que estudaremos na seção 8 8. Campo eletromagnético As equações do campo eletromagnético são as equações de Maxwell, que no espaço vazio se leem [60, 61] (em unidades com c = 1, como temos determinado de início): (228) ∇ ⋅ E = 0 ; ∇ ⋅ B = 0 ; ∇ × E + ∂ ⁡ B ∂ ⁡ t = 0 ; ∇ × B - ∂ ⁡ E ∂ ⁡ t = 0 . Em função do «tensor de Faraday» Fμν, definido da forma seguinte: (229) [ F μ ⁢ ν ] := ( 0 E x E y E z - E x 0 - B z B y - E y B z 0 - B x - E z - B y B x 0 ) = - [ F ν ⁢ μ ] , as equações de Maxwell no vácuo se escrevem: (230) ∂ μ ⁡ F μ ⁢ ν = 0 , ∂ ρ ⁡ F μ ⁢ ν + ∂ μ ⁡ F ν ⁢ ρ + ∂ ν ⁡ F ρ ⁢ μ = 0 , essa última conhecida como «identidade de Bianchi». Essas equações permitem a introdução do «potencial eletromagnético», Aμ(x), segundo: (231) F μ ⁢ ν = : ∂ μ A ν - ∂ ν A μ . A este campo chamaremos doravante «campo eletromagnético», ou às vezes –para explicitar que ele será considerado livre– «campo da radiação». Ao passo que a identidade de Bianchi se mantém idênticamente satisfeita, a equação do movimento do campo eletromagnético [primeira das equações (230)] se reescreve: (232) □ ⁢ A ν ⁢ ( x ) - ∂ ν ⁡ ( ∂ μ ⁡ A μ ⁢ ( x ) ) = 0 , que pode ser obtida da densidade lagrangiana: (233) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν . 8.1. Componentes dinâmicas e não-dinâmicas. Condição de gauge do plano nulo Poderia parecer, olhando para a equação (232), que o campo de radiação não está obrigado a satisfazer a equação de Klein-Gordon-Fock. No entanto, o termo adicional pode ser removido pela imposição de uma condição subsidiária (condição de gauge ou de calibre) cuja possibilidade se manifesta pela não unicidade da relação entre o potencial e os campos E e B: Estes não são modificados se o potencial é redefinido pela adição de um termo de divergência, Aμ → Aμ + ∂μ f.15 Para tal remoção bastará exigir que seja ∂ν⁡(∂μ Aμ) = 0, que é o mesmo que ∂μ Aμ = constante; impondo então que o campo se anule no infinito, a constante deve por força ser nula e, assim, a equação de Klein-Gordon-Fock é obedecida sob a «condição de gauge de Lorenz»16: (234) ∂ μ ⁡ A μ ⁢ ( x ) = ∂ + ⁡ A + + ∂ ⊥ ⁡ A ⊥ + ∂ - ⁡ A - = 0 . Essa condição de gauge elimina um grau de liberdade da teoria, mas não elimina por completo a liberdade de gauge, pois ainda a equação de Klein-Gordon-Fock e a condição de gauge de Lorenz serão satisfeitas simultâneamente caso se opere uma transformação de gauge com uma função harmônica,17 □ f = 0. Para eliminar por completo a liberdade de gauge deve ser imposta uma condição adicional; a simplificação máxima na dinâmica da frente de luz consiste em tornar a condição de gauge de Lorenz numa relação puramente cinemática, eliminando toda dependência temporal nela; para tal será suficiente exigir que seja ∂+A+ = 0, mas então a equação □ A+ = 0 será igual a ∂⊥2⁡A+=0, cuja solução, sob as condições assintóticas de desvanecimento no infinito, é a nula. A essa se chama a «condição de gauge do plano nulo»18: (235) A + ⁢ ( x ) = 0 . Isto elimina toda a liberdade de gauge, mostrando que o campo eletromagnético possue dois graus de liberdade. Efetivamente, toda a informação está contida nas equações dinâmicas para as componentes transversais: (236) □ ⁢ A α ⁢ ( x ) = 0 , e nas equações de vínculo que provêm das condições de gauge [equações (234) e (235)]: (237) A + = 0 , A - = - 1 ∂ - ⁢ ∂ α ⁡ A α . As componentes transversais Aα são chamadas «componentes dinâmicas» do campo de radiação, enquanto que A+ e A− são as «não-dinâmicas», por estarem totalmente determinadas pelos vínculos. É útil mencionar adicionalmente que, como afirmado nas Refs. [14, 15, 24], a análise que fizemos antes do problema de Goursat [vide a seção 3] pode ser fácilmente extendida para um campo Φ(x) que obedece a equações do tipo: (238) ∂ + ⁡ ∂ - ⁡ Φ ⁢ ( x ) = L ⁢ Φ ⁢ ( x ) + Ψ ⁢ ( x ) , com L um operador diferencial linear que não contém derivadas temporais ∂+ e Ψ(x) um campo diferente do Φ(x). As equações (232) são desse tipo para ν = 1, 2 somente sob a condição de gauge do plano nulo. A equação para ν = + se equivale então à condição de gauge de Lorenz com A+ = 0 –sob as condições assintóticas que estamos usando–, e esta torna uma identidade a equação para ν = − . As duas condições de gauge, de qualquer forma, são compatíveis –no caso livre– e devem ser usadas simultâneamente. No gauge do plano nulo, a densidade lagrangiana da equação (233) se simplifica a: (239) ℒ A = ∂ + ⁡ A ⊥ ⁢ ∂ - ⁡ A ⊥ + ∂ - ⁡ A ⊥ ⁢ ∂ ⊥ ⁡ A - - 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 + 1 2 ⁢ ( ∂ - ⁡ A - ) 2 . Ou ainda, em função das componentes dinâmicas só: (240) ℒ A = ∂ + ⁡ A ⊥ ⁢ ∂ - ⁡ A ⊥ + ( A α ⁢ ∂ α ) ⁢ ( ∂ β ⁡ A β ) + 1 2 ⁢ ( ∂ ⊥ ⁡ A ⊥ ) 2 - 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 . O tensor de energia-momento é: (241) Θ = ν μ ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A σ ) ∂ ν A σ - δ ν μ ℒ A = F ∂ ν σ μ A σ + 1 4 δ F σ ⁢ τ ν μ F σ ⁢ τ . Particulamente, o hamiltoniano invariante no gauge do plano nulo é: (242) H N ⁢ P ; A = ∫ d 3 x ¯ [ 1 2 ( ∂ 1 A 2 - ∂ 2 A 1 ) 2 - ∂ - A ⊥ ∂ ⊥ A - - 1 2 ( ∂ - A - ) 2 ] . Ou, escrito somente em função das componentes dinâmicas: (243) H N ⁢ P ; A = ⁢ ∫ d 3 ⁢ x ¯ ⁢ [ 1 2 ⁢ ( ∂ 1 ⁡ A 2 - ∂ 2 ⁡ A 1 ) 2 + 1 2 ⁢ ( ∂ ⊥ ⁡ A ⊥ ) 2 ] . 8.2. Problema de Goursat O problema de Goursat para o campo eletromagnético possui uma consequência notável: Ele garante a preservação no tempo das condições de gauge. Com efeito, dada a equação (236), as componentes transversais têm a solução: (244) A α ⁢ ( x ) = ∫ y + = y 0 + d 3 ⁢ y ¯ ⁢ D 0 ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ A α ⁢ ( y ) , com o subíndice «0» sob a distribuição de Jordan-Pauli indicando que nela a massa é nula: m = 0. Escrevamos a solução completa da forma: (245) A a ( x ) = ∫ y + = y 0 + d 3 y ¯ D ( x - y ) b a ∂ ↔ - y A b ( y ) . A equação (244) é recuperada sob a condição de ser: (246) D = β α δ β α D 0 , D = - α 0 , enquanto que as condições de vínculo da equação (237) são satisfeitas, uma vez impostas no plano nulo y+=y0+, se: (247) D = α + 0 , D = - + 0 , D = - - 0 , D = α - - 1 ∂ - ∂ α D 0 . Nota-se que não é preciso exigirmos valores particulares de D+a, uma vez que imporemos que seja A+ = 0 no plano nulo inicial. Todas essas condições são satisfeitas com a escolha: (248) D = b a ( δ b a - η a ⁢ ∂ b + η b ⁢ ∂ a ∂ - ) D 0 ( x ) , (249) ( η a ) = ( 0 ; 0 ⊥ ; 1 ) . Assim, se no plano y+=y0+ são impostas as condições de gauge de Lorenz e do plano nulo, então elas se manterão em todo tempo posterior na evolução dinâmica do campo. 8.3. Vetores de polarização Já dissemos repetidamente que sob a condição de gauge de Lorenz cada componente do campo da radiação satisfaz a equação de Klein-Gordon-Fock: (250) □ ⁢ A a ⁢ ( x ) = 0 . Consequentemente, cada uma dessas componentes poderá ser expandida como uma integral de Fourier como na equação (179): (251) A a ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) × ∑ λ ( ε λ ( p ¯ ) a ⁣ * A ( λ ; p ¯ ) e - i ⁢ p ⁢ x + ε λ ( p ¯ ) a A ( λ ; p ¯ ) * e i ⁢ p ⁢ x ) | p + = E , comελ⁢(p¯)a os vetores de polarização do campo (λ = + , ⊥, − ). Se eles são escolhidos reais, então a equação anterior se reduz à: (252) A a ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 / 2 ⁢ ∫ d 3 ⁢ p ¯ | 2 ⁢ p - | ⁢ Θ ⁢ ( p - ) ⁢ ∑ λ ε λ ⁢ ( p ¯ ) a × ( A ⁢ ( λ ; p ¯ ) ⁢ e - i ⁢ p ⁢ x + A ⁢ ( λ ; p ¯ ) * ⁢ e i ⁢ p ⁢ x ) | p + = E . O caráter vetorial do campo eletromagnético está, então, contido nos vetores de polarização e, portanto, (da mesma forma que acontecia com os espinores de polarização do campo de Dirac) devem carregar também a informação relativa aos vínculos impostos. Ora, como este campo possui somente dois graus de liberdade, também serão só dois os vetores de polarização dinâmicos; diremos que estes são aqueles com λ = 1, 2. As duas condições de gauge explicitadas na equação (237) são obtidas pelo uso dos vetores de polarização: (253) ε 1 ⁢ ( p ¯ ) a = ( 0 ; 1 ; 0 ; - p 1 p - ) , ε 2 ⁢ ( p ¯ ) a = ( 0 ; 0 ; 1 ; - p 2 p - ) , cuja norma é: (254) η a ⁢ b ⁢ ε α ⁢ ( p ¯ ) a ⁢ ε β ⁢ ( p ¯ ) b = - δ β α , o que indica que estão normalizados e são do tipo-espaço. O cálculo direto então mostra que tais vetores de polarização físicos seguem a regra de soma: (255) ∑ λ = 1, 2 ε λ ⁢ ( p ¯ ) a ⁢ ε λ ⁢ ( p ¯ ) b = - η a ⁢ b + p a ⁢ η b + η a ⁢ p b p - - p 2 p - 2 ⁢ η a ⁢ η b . Isto estabelece uma relação importante com o problema de Goursat: Devido à igualdade p2δ(p2) = 0 [62], as equações (83) e (248) implicam que, no espaço dos momentos: (256) D ^ a ⁢ b ⁢ ( p ) = - ∑ λ = 1, 2 ε λ ⁢ ( p ¯ ) a ⁢ ε λ ⁢ ( p ¯ ) b ⁢ D ^ 0 ⁢ ( p ) . Devemos finalmente nos ocupar da definição dos outros dois vetores de polarização, embora eles não se manifestem fisicamente. Como o conjunto dos quatro vetores hão de formar uma base para o espaço-tempo de Minkowski, requeriremos sua ortonormalidade –que é uma extensão da equação (254)–: (257) η a ⁢ b ⁢ ε λ ⁢ ( p ¯ ) a ⁢ ε λ ′ ⁢ ( p ¯ ) b = η λ ⁢ λ ′ , equivalente à relação de completeza: (258) ∑ λ ⁢ λ ′ η λ ⁢ λ ′ ⁢ ε λ ⁢ ( p ¯ ) a ⁢ ε λ ′ ⁢ ( p ¯ ) b = η a ⁢ b . Digamos que sejam (259) ε + ⁢ ( p ¯ ) a = ( a ; b ; c ; d ) , ε - ⁢ ( p ¯ ) a = ( e ; f ; g ; h ) . As condições de serem ε+⁢(p¯)a⁢ε+⁢(p¯)a=0, ε1⁢(p¯)a ε+⁢(p¯)a=0 e ε2⁢(p¯)a⁢ε+⁢(p¯)a=0 levam a que, quer a ≠ 0 e (260) ε + ⁢ ( p ¯ ) a = a ⁢ ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , quer a = 0 e (261) ε + ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; d ) . Analogamente, as condições de serem ε-⁢(p¯)a⁢ε-⁢(p¯)a=0, ε1⁢(p¯)a⁢ε-⁢(p¯)a=0 e ε2⁢(p¯)a⁢ε-⁢(p¯)a=0 implicam que, quer e ≠ 0 e (262) ε - ⁢ ( p ¯ ) a = e ⁢ ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , quer e = 0 e (263) ε - ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; h ) . Evidentemente, somente poderá ser a ≠ 0 e e = 0, ou a = 0 e e ≠ 0, pois de outra forma os vetores serão proporcionais um ao outro. Qual dessas duas possibilidades deve ser usada, é impossível dizê-lo; é matéria de escolha. Escolheremos a primeira. Então a condição de ser ε+⁢(p¯)a⁢ε-⁢(p¯)a=1 implica que: ah = 1, cuja mais simples solução é: a = 1 = h. Os vetores de polarização não-dinâmicos serão portanto: (264) ε + ⁢ ( p ¯ ) a = ( 1 ; - p 1 p - ; - p 2 p - ; p ⊥ 2 2 ⁢ p - 2 ) , (265) ε - ⁢ ( p ¯ ) a = ( 0 ; 0 ; 0 ; 1 ) . –. Lembremos ao leitor que a obtenção dessa equação obedece ao fato de que os campos se transformam por representações do grupo de Poincaré, um de cujos operadores de Casimir é o quadrado do operador de momento: P2, então proporcional à identidade (com fator de proporcionalidade que temos denotado por m2), como o assegura o lema de Schur.

Determinar quais dados são os que se precisa conhecer para poder antecipar o valor do campo em um ponto futuro é o problema dos valores iniciais, que para equações diferenciais de segunda ordem pode ser precisamente formulado da seguinte forma [51]:

Problema dos valores iniciais: Seja

(57) ϕ ( u ; x i ; u x i ; 2 u x i 2 ; 2 u x i x k ) = 0 ( i = 1 , , m )

uma equação diferencial parcial de segunda ordem, linear em u e suas derivadas com coeficientes que são funções quaisquer das variáveis xi. O problema dos valores iniciais com respeito à «superfície inicial» xm = 0 consiste em encontrar uma solução sujeita aos «dados iniciais»:

(58) u ( x 1 ; ; x m - 1 ; 0 ) = u 0 ( x 1 ; ; x m - 1 ) , u x m ( x 1 ; ; x m - 1 ; 0 ) = u 1 ( x 1 ; ; x m - 1 ) .

É claro, toda equação diferencial, quer ordinária, quer parcial, admite um número infinito de soluções, que são escritas como uma «integral geral» contendo um determinado número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em seu enunciado um conjunto de condições adicionais –os dados iniciais– que visam determinar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possível com elas determinar uma e só uma solução, pois pode acontecer que os dados iniciais sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os elementos arbitrários. Assim, diremos que o problema dos valores iniciais está bem definido se ele (i) tem solução, e (ii) dita solução é única.

3.1. Problema de Cauchy-Kovalevskaya

O caso mais famoso do problema dos valores iniciais é o «problema de Cauchy», que se caracteriza porque na equação diferencial a segunda derivada de u em relação à variável xm que define a superfície inicial xm = 0 possui um coeficiente não nulo. As condições sob as quais o problema de Cauchy está bem definido são estabelecidas no seguinte teorema, que apresentaremos para o caso de duas variáveis independentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–:

Teorema de Cauchy-Kovalevskaya: Seja o problema de valores iniciais para a equação diferencial parcial de segunda ordem e duas variáveis

(59) ϕ ( u ; x ; y ; u x ; u y ; 2 u x 2 ; 2 u y 2 ; 2 u x y ) = 0 .

Se acontece que

(60) ϕ ( 2 u / x 2 ) 0 ,

de tal forma que podemos escrever a equação (59) na forma:

(61) 2 u x 2 = f ( u ; x ; y ; u x ; u y ; 2 u y 2 ; 2 u x y ) ,

com f uma função holomórfica –isto é, analítica e regular– na vizinhança de x = 0, então o problema de Cauchy está bem definido para qualquer valor funcional dos dados de Cauchy:

(62) u ( 0 ; y ) = u 0 ( y ) e u x ( 0 ; y ) = u 1 ( y ) .

O leitor interessado nos detalhes técnicos desse teorema pode consultar as Refs. [51, 52]. O que aqui exporemos é a construção da solução, que tem como consequência direta a sua unicidade. Escrevamos a função incógnita u(x; y) como série de potências na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy:

(63) u = u 0 + u 1 x + + u h h ! x h + ; u h = u h ( y ) h u x h | x = 0 .

Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1, portanto, devemos nos preocupar em encontrar uh para h ≥ 2 em função deles. Notando que, em geral:

(64) h + k u x h y k | x = 0 = k u h y k ,

podemos obter a solução desejada com o seguinte conjunto de passos: Tomando x = 0 na equação (61) obtemos:

(65) u 2 = f ( u 0 ; 0 ; y ; u 1 ; u 0 y ; 2 u 0 y 2 ; u 1 y ) ,

o que significa que u2 está determinado pelo conhecimento de u0 e u1. O fato de aparecer também suas derivadas na equação (65) não é motivo de preocupação, pois elas estão tomadas em relação à variável y com x = 0, e, portanto, podem se obter dos dados de Cauchy. Derivemos agora a equação (61) em relação a x, então coloquemos x = 0; obteremos:

(66) u 3 = f u u 1 + f x + f ( u / x ) u 2 + f ( u / y ) u 1 y + + f ( 2 u / x y ) u 2 y ,

todas essas derivadas tomadas nos argumentos de f na equação (65). Assim, a equação (66) diz que a função u3 está determinada pelos dados de Cauchy e a função u2 obtida com eles. Note também que a condição de f ser holomórfica na vizinhança de x = 0 tem sido usada para tomar sua derivada nesse ponto. Isto ocorre também nos seguintes termos na seqüência da equação (63), que são obtidos por derivação sucessiva da equação (61) em x = 0: o resultado será sempre que a função uh é um polinômio de u0, u1, …, uh − 1 e suas derivadas, assim como de f e suas derivadas tomadas nos argumentos da equação (65).

Uma vez que conhecemos as funções uh, podemos expressá-las como séries de potências na variável y ao redor do valor y0 fixo:

(67) u h ( y ) = k u h k k ! ( y - y 0 ) k ,

e, então, a solução completa do problema de Cauchy é:

(68) u ( x ; y ) = h , k u h k h ! k ! x h ( y - y 0 ) k ,

com todos os coeficientes uhk determinados pelos dados de Cauchy. Como os coeficientes são únicos, podemos estabelecer: O problema de Cauchy não admite mais de uma solução holomórfica, representada pela série da equação (68). Essa é a unicidade da solução. Sua existência depende do fato da série da equação (68) ser convergente para |x| e |yy0| limitados por certos valores apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial de segunda ordem possui problema de Cauchy bem definido se especificarmos a função e sua primeira derivada em relação a uma de suas variáveis numa superfície em que dita variável adota um valor fixo, e que, ademais, se a solução existe, então ela é única.

Problema de Cauchy-Kovalevskaya para a equação de Klein-Gordon-Fock. Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [equação (56)]. Como estamos interessados na evolução temporal da solução, escolheremos a variável t para enunciar o problema de Cauchy –notando que essa escolha determina já o uso da dinâmica instantânea–: Seja u(x) = u(t; x) uma função que satisfaz à equação de segunda ordem:

(69) 2 u t 2 ( x ) = ( 2 - m 2 ) u ( x ) ,

sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0:

(70) u ( 0 ; x ) = u 0 ( x ) e t u ( 0 ; x ) = u 1 ( x ) .

Logo, vemos que a equação (69) tem a forma da equação (61) e, portanto, a tese do teorema de Cauchy-Kovalevskaya é aplicável. Para solucionar tal equação passamos ao espaço dos momentos por meio da transformação de Fourier aplicada à função u. Substituíndo-a na equação (69) vemos que ela tem de ter a forma:

(71) u ( x ) = ( 2 π ) - 2 d 4 p δ ( p 2 - m 2 ) u ( p ) e - i p x = ( 2 π ) - 2 d 4 p | 2 p 0 | [ δ ( p 0 - ω p ) + δ ( p 0 + ω p ) ]
(72) × u ( p ) e - i p x ,

com: ωpp2+m2 –pode-se reconhecer aqui a forma do gerador P0 da equação (32)–. Integrando na variável p0 com o uso das distribuições delta de Dirac, obtemos a separação em partes de freqüência positiva e freqüência negativa:

(73) u ( x ) = ( 2 π ) - 2 d 3 p 2 ω p [ u + ( p ) e - i p x | p 0 = ω p + u - ( p ) e - i p x | p 0 = - ω p ] .

Coloquemos aqui os dados de Cauchy da equação (70). Primeiramente, como u0(x) = u(0; x):

(74) u 0 ( x ) = ( 2 π ) - 2 d 3 p 2 ω p [ u + ( p ) + u - ( p ) ] e i p x .

Mas podemos escrever:

(75) u 0 ( x ) = d 3 y u 0 ( y ) δ ( x - y ) = ( 2 π ) - 3 d 3 p ( d 3 y u 0 ( y ) e - i p y ) e i p x ,

a partir do qual obtemos, via uma comparação das equações (74) e (75) e a independência linear das funções exponenciais eipx, que:

(76) u + ( p ) + u - ( p ) = 2 ω p ( 2 π ) - 1 d 3 y u 0 ( y ) e - i p y .

Usaremos agora os dados de Cauchy referidos à derivada de u. Como u1(x) = ∂tu(0; x):

(77) u 1 ( x ) = ( 2 π ) - 2 d 3 p 2 ω p ( - i ω p ) [ u + ( p ) - u - ( p ) ] e i p x ,

e, novamente reescrevendo o lado esquerdo com ajuda da distribuição delta de Dirac tridimensional e comparando com a equação (77), encontramos que:

(78) u + ( p ) - u - ( p ) = 2 i ( 2 π ) - 1 d 3 y u 1 ( y ) e - i p y .

As equações (76) e (78) nos permitem encontrar explicitamente as funções u±(p) em dependência com os dados de Cauchy u0 e u1:

(79) u ± ( p ) = ( 2 π ) - 1 d 3 y [ ω p u 0 ( y ) ± i u 1 ( y ) ] e - i p y .

Substituíndo-as na equação (73) e completando py = py|y0 = 0, o que serve para escrever a integração com medida d3y explícitamente na superfície y0 = 0 em que são fornecidos os dados de Cauchy:

(80) u ( x ) = ( 2 π ) - 3 d 4 p δ ( p 2 - m 2 ) y 0 = 0 d 3 y × [ ω p u 0 ( y ) + i sgn ( p 0 ) u 1 ( y ) ] e - i p ( x - y ) .

É possível escrever:

(81) ω p e - i p ( x - y ) = i sgn ( p 0 ) 0 x e - i p ( x - y ) ,

e assim:

(82) u ( x ) = y 0 = 0 d 3 y [ u 0 ( y ) 0 x D ( x - y ) + D ( x - y ) u 1 ( y ) ] ,

com a definição da «distribuição de Jordan-Pauli»:

(83) D ( x ) := i ( 2 π ) - 3 d 4 p δ ( p 2 - m 2 ) sgn ( p 0 ) e - i p x .

Esta distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac que aparece em seu integrando, ela satisfaz a equação de Klein-Gordon-Fock com massa m, isto é, a mesma equação diferencial do campo u:

(84) ( + m 2 ) D ( x ) = 0 .

Também, de sua forma explícita dada na equação (83):

(85) D ( x ) = - D ( - x ) .

Fazendo uso, precisamente, desta última propriedade, podemos escrever a equação (82) com a derivada que age sobre D(xy) não sendo já na variável x0, mas na variável y0:

(86) u ( x ) = y 0 = 0 d 3 y [ u 0 ( y ) 0 y D ( y - x ) - D ( y - x ) u 1 ( y ) ] .

Essa mudança é útil porque, lembremos: u1(y)=0yu(0;y); mas o fato de ser y0 = 0 já está indicado na integral e, então, podemos escrever simplesmente, dentro dela, u1(y)=0yu(y) e u0(y) = u(y). Assim:

(87) u ( x ) = y 0 = 0 d 3 y u ( y ) 0 y D ( y - x ) .

Aqui, o símbolo fg significa fg − ∂ fg. Usando mais uma vez a equação (85), a equação (87) é igual a:

(88) u ( x ) = y 0 = 0 d 3 y D ( x - y ) 0 y u ( y ) .

Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície y0 = 0, que, existindo, é única, como demonstrado na construção anterior. A causalidade da qual falávamos se evidencia na expressão –os detalhes do cálculo são mostrados, por exemplo, na Ref. [53]–:

(89) D ( x ) = 1 2 π sgn ( x 0 ) [ δ ( x ) - Θ ( x 2 ) m 2 x 2 J 1 ( m x 2 ) ] ,

o que implica que:

(90) supp ( D ( x ) ) = V + ( 0 ) V - ( 0 ) ,

com:

(91) V + ( x ) := { y 𝕄 | ( y - x ) 2 0 y 0 x 0 }

o «cone de luz futuro em relação ao ponto x», e

(92) V - ( x ) := { y 𝕄 | ( y - x ) 2 0 y 0 x 0 }

o «cone de luz passado em relação ao ponto x». Para terminar de introduzir a nomenclatura, digamos que a união V+(x)∪ V(x) é o «cone de luz com vértice no ponto x». Isto é, D(x) tem suporte causal em relação à origem do sistema de coordenadas. Vejamos o que isto quer dizer à luz da equação (87): Da equação (90) temos que, transladando a origem até o ponto x em que queremos conhecer o valor do campo u, D(yx) tem suporte no cone de luz com vértice em x, isto é, u(x) não é afetado pelos valores que no passado o campo tomou fora do cone de luz de x, nem afetará os valores que o campo tomará fora do cone de luz de x no futuro.

3.2. Problema de Goursat

Consideremos agora que: nossa solução, embora satisfatória, não é tão geral como gostaríamos, pois precisa do conhecimento dos dados iniciais numa superfície de tempo constante, o que obriga a escolha da forma dinâmica instantânea. Mas, o que aconteceria se os dados fossem conhecidos numa superfície diferente? Voltemos ao problema de valores iniciais como enunciado na equação (57), e suponhamos que o espaço m-dimensional seja submetido à transformação de coordenadas:

(93) X 1 = G 1 ( x 1 ; ; x m ) , , X m = G m ( x 1 ; ; x m ) ,

de tal forma que Xm = Gm(x1;⋯; xm) = 0 seja a superfície em que são conhecidos os dados iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas, com u(x1;⋯; xm) = U(G1(x1;⋯; xm);⋯; Gm(x1;⋯; xm)):

(94) Φ ( U ; X i ; U X i ; 2 U X i 2 ; 2 U X i X k ) = 0 .

Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações na teoria, pois parece que podemos simplesmente aplicar o teorema de Cauchy-Kovalevskaya à nova equação diferencial. Porém, suponhamos que a equação (59) seja linear, e que tem portanto a seguinte forma geral:

(95) i , k A i k 2 u x i x k + i B i u x i + C u = f ,

com Aik = Aki, Bi, C e f funções das variáveis xi. Suponhamos agora que as transformações da equação (93) sejam feitas. Então usando a regra da cadeia obtemos que a equação (95) é, em relação às variáveis Xi:

(96) j , l ( i , k A i k G j x i G l x k ) 2 U X j X l + l ( i B i G l x i ) U X l + C U = f .

Como temos observado, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumprimento da equação (60), isto é, ele será aplicável só se 2U/Xm2 aparece na equação (96). Isto coloca em primeiro plano a «forma característica» 𝔸 definida como5:

(97) 𝔸 ( γ 1 ; ; γ m ) := i , k γ i A i k γ k .

Da equação (96) vemos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz se:

(98) i , k A i k G m x i G m x k = 0 .

Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode ser realizada trivialmente. As superfícies Gm(x1;⋯; xm) = 0 para as quais isto acontece recebem o nome de «superfícies características» da equação diferencial. O problema dos valores iniciais em que a superfície inicial é uma superfície característica é conhecido como «problema de Goursat» [54], e o desenvolveremos a seguir.

Seja a seguinte equação diferencial em que a segunda derivada em relação à variável xm não pode ser isolada, pois não aparece; ou seja, a equação diferencial escrita em termos de coordenadas tais que a superfície xm = 0 é uma superfície característica (Amm = 0):

(99) i k A i k 2 u x i x k + i = 1 m - 1 A i i 2 u x i 2 + i B i u x i + c u = f .

Nosso primeiro propósito será ver se os dados iniciais que são suficientes no problema fora de superfícies características são também suficientes nesse caso. Suponhamos, pois, que sejam conhecidos:

(100) u ( x 1 ; ; x m - 1 ; 0 ) = u 0 ( x 1 ; ; x m - 1 ) ; u x m ( x 1 ; ; x m - 1 ; 0 ) = u 1 ( x 1 ; ; x m - 1 ) .

Façamos, como anteriormente, a expansão ao redor de xm = 0:

(101) u = u 0 + u 1 x m + + u h h ! x m h + ; u h = u h ( x 1 ; ; x m ) h u x m h | x m = 0 .

Colocando essa expansão na equação (99), então avaliando em xm = 0, obtemos já não uma expressão para u2 como outrora obtivemos, mas uma equação diferencial para u1:

(102) 2 i m A i m u 1 x i + B m u 1 + H 1 = 0 ,

com H1 dependendo somente de u0 e suas derivadas:

(103) H 1 = i m , k m , i k A i k 2 u 0 x i x k + i m A i i 2 u 0 x i 2 + i m B i u 0 x i + C u 0 - f .

Vemos, pois, que se u1 não for dado de forma a satisfazer essa equação diferencial, então o problema de valores iniciais com os dados iniciais da equação (100) não tem solução. Portanto, precisamos fornecer outros dados iniciais, a saber, os necessários para que as equações diferenciais que se obtêm para as funções uh possam ser univocamente solucionadas.

A equação (102) é uma equação diferencial parcial de primeira ordem para u1. Vejamos se também as equações para os outros uh são desse tipo. Derivando a equação (99) h − 1 vezes em relação a xm e então tomando xm = 0, obtemos a equação diferencial para uh:

(104) 2 i m A i m u h x i + B m u h + H h = 0 ,

com:

(105) H h = i m , k m , i k A i k 2 u h - 1 x i x k + i m A i i 2 u h - 1 x i 2 + i m B i u h - 1 x i + C u h - 1 - h - 1 f x m h - 1 .

Observamos que todas as equações diferenciais que se obtêm para as funções uh são de primeira ordem. Para solucioná-las, estudemos o método das características para esse tipo de equações. Para simplificar a exposição, além disso, consideremos o caso de duas variáveis e suponhamos que queremos resolver a equação:

(106) A ( x ; y ) u x + B ( x ; y ) u y - C ( x ; y ; u ) = 0 .

As equações (104) são todas desse tipo, com a particularidade de ser A(x; y) = 0, o que colocaremos no final. Solucionar a equação (106) significa determinar uma solução u = z(x; y); essa superfície solução tem vetor normal n = (∂ z/∂ x;∂ z/∂ y; − 1); portanto, definindo o campo vetorial F = (A; B; C), a equação (106) pode ser escrita como:

(107) F n = 0 .

Ou seja, F é tangente à superfície solução u = z(x; y), tendo como consequência que esta é constituída por curvas integrais daquela; tais curvas integrais são chamadas «curvas características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os valores de u(x; y) numa curva γ no plano xy, cujo uso permite estabelecer a curva Γ sobre a superfície z(x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser gerada uma curva integral de F, construindo assim a superfície z(x; y). Levando a ideia à prática, podemos parametrizar, para a em algum domínio de variação:

(108) Γ ( a ) = ( x = x 0 ( a ) ; y = y 0 ( a ) ; z = z 0 ( a ) ) .

Determinar para cada valor de a uma curva integral de F que passe por Γ(a) significa resolver, para cada valor de a, o «sistema de equações diferenciais de Lagrange-Charpit»: Para um parâmetro s:

(109) d x d s = A ( x ; y ) ; x ( 0 ) = x 0 ( a ) ,
(110) d y d s = B ( x ; y ) ; y ( 0 ) = y 0 ( a ) ,
(111) d z d s = C ( x ; y ; z ) ; z ( 0 ) = z 0 ( a ) .

As soluções desse sistema,

(112) x = X ( a ; s ) , y = Y ( a ; s ) , z = Z ( a ; s ) ,

são já uma representação paramétrica da superfície solução. Para obtê-la na forma u = z(x; y), precisaremos inverter:

(113) a = Λ ( x ; y ) e s = S ( x ; y ) ,

com o qual a solução buscada será:

(114) u ( x ; y ) = Z ( Λ ( x ; y ) ; S ( x ; y ) ) .

Vale ressaltar que para que possa ser gerada a superfície solução a partir da curva Γ por ação do campo vetorial F, é preciso que Γ não seja já uma curva característica –uma curva integral de F–, pois então ela seria invariante pela ação de F. Vejamos como isto funciona em nosso caso: As equações (104) dão lugar às equações de Lagrange-Charpit com o lado direito da equação (109) nulo:

(115) d x d s = 0 ; x ( 0 ) = x 0 ( a ) .

Isto é, x é independente do parâmetro s. Se os dados iniciais fossem dados numa linha de x = constante, então x seria também independente de a; logo não poderíamos obter a solução do sistema mais que para um valor constante de x. Concluimos: Os dados iniciais que são precisos para solucionar univocamente as equações (104) não podem ser dados na superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, se os dados iniciais estão na linha de y constante:

(116) Γ = ( x = x 0 ( a ) ; y = y 0 ; z = z 0 ( a ) ) ,

com y0 independente de a. A equação (115) tem solução: x = x0(a). Substituíndo na equação (110), como x é independente de s, a integração se torna elementar:

(117) s = y 0 y d y B ( x 0 ( a ) ; y ) .

Finalmente, a equação (111) será:

(118) d z d s = C ( x 0 ( a ) ; y ( a ; s ) ; z ) ; z ( 0 ) = z 0 ( a ) ,

que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução única.

A análise recém realizada demonstra que as equações (104) que determinam as funções uh poderão ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por exemplo, com xk = constante, km. Conclui-se que, quando o problema de valores iniciais está definido sobre uma superfície característica da equação diferencial, os dados iniciais não podem ser o valor da função e sua primeira derivada normal à superfície característica, pois em tal caso o problema pode não ter solução ou ter infinitas soluções. Em seu lugar, devem ser dados: o valor da função na superfície característica e o valor da função em uma superfície diferente dela.

3.3. Superfícies características da equação de Klein-Gordon-Fock

Uma vez que temos visto que o problema de valores iniciais pode ser bem definido sobre superfícies características, apliquemos o conhecimento adquirido para a equação de Klein-Gordon-Fock com que iniciamos essa discusão [equação (56)]:

(119) 2 u t 2 - 2 u x 2 - 2 u y 2 - 2 u z 2 + m 2 u = 0 .

Comparando com a equação (95), reconhecemos que para essa equação são6:

(120) A μ ν = η ~ μ ν , B μ = 0 , C = m 2 e f = 0 .

Aqui, η~μν são as componentes do tensor métrico do espaço-tempo de Minkowski: (η~μν)=diag(+1;-1;-1;-1). A forma característica [vide a equação (97)] é aqui η~μνγμγν, que se anula para γμ um vetor tipo-luz:

(121) ( γ 0 ) 2 = γ 2 .

Assim sendo, a transformação de coordenadas Xμ = Gμ(t; x; y; z) será tal que X0 = constante é uma superfície característica se [vide a equação (98)] a função G0 satisfaz à equação diferencial:

(122) ( G 0 t ) 2 - ( G 0 x ) 2 - ( G 0 y ) 2 - ( G 0 z ) 2 = 0 ,

cuja solução é:

(123) G 0 = a t + b x + c y + d z ; a = ± b 2 + c 2 + d 2 .

Isto é, as superfícies características da equação de Klein-Gordon-Fock são as superfícies X0 = 0, com:

(124) X 0 t ± b x + c y + d z b 2 + c 2 + d 2 ,

ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade com a coordenada X0, podendo ser arbitráriamente escolhidas. Façamos uma escolha:

Definição: Sejam (x0; x1; x2; x3) coordenadas cartesianas no espaço-tempo de Minkowski tais que o tensor métrico adota sua forma diagonal normalizada η~μν. O conjunto de coordenadas (x+; x1; x2; x-), com:

(125) x + := 1 2 ( x 0 + x 3 ) , x - := 1 2 ( x 0 - x 3 ) ,

é chamado conjunto de coordenadas do plano nulo.

A eleição da superfície característica em que os dados iniciais sejam dados, quer x+ = 0, quer x = 0, é um assunto puramente convencional, mas importante por ser, implícitamente, uma eleição do parâmetro de evolução dos campos, que doravante chamaremos «tempo». Escolhemos x+ como coordenada temporal; a seguinte nomenclatura é usada: x é a coordenada «longitudinal», e x = (x1; x2) são as coordenadas «transversais». As coordenadas cartesianas (x0; x1; x2; x3) passarão a ser chamadas «coordenadas instantâneas», por razões óbvias. O fator de proporcionalidade escolhido na definição de x± na equação (125) tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é igual à unidade, de forma que o elemento de volume não muda:

(126) d 4 x = d x + d x - d 2 x .

Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte representação matricial:

(127) [ η a b ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) = [ η a b ] .

Pelo proferido, concluímos que o problema de Goursat da equação de Klein-Gordon-Fock é o problema dos valores iniciais na dinâmica da frente de luz. E mais ainda: Essa é a única exceção à aplicabilidade do teorema de Cauchy-Kovalevskaya: É a única forma dinâmica na qual o problema dos valores iniciais não pode ser obtido por deformação da superfície inicial em alguma outra forma dinâmica.

Passemos a estabelecer a solução do problema de Goursat da equação de Klein-Gordon-Fock. Para isso, lembremos da equação (88): Em coordenadas instantâneas:

(128) u ( x ) = y 0 = 0 d 3 y D ( x - y ) 0 y u ( y ) .

Denotemos a versão tetra-vetorial do integrando por Nμ(x; y):

(129) N μ ( x ; y ) = D ( x - y ) y μ u ( y ) .

Tomando a divergência em relação à variável y, vemos que:

(130) μ y N μ ( x ; y ) = D ( x - y ) y u ( y ) - y D ( x - y ) u ( y ) = 0 ,

pois tanto u como D satisfazem à equação de Klein-Gordon-Fock de massa m [vide a equação (84)]. Portanto, sendo de divergência nula, podemos usar o teorema de Gauss no volume Ω limitado pelo sólido ABCD na Fig. 4 –compare-se essa figura com a 3–, em que o ponto P, vértice do cone de luz, representa o ponto x em que desejamos conhecer o valor do campo u. Então teremos que:

Figura 4
Volume de integração para a obtenção da solução do problema de Goursat da equação de Klein-Gordon-Fock.
(131) 0 = Ω d 4 y μ y N μ ( x ; y ) = Ω d σ μ ( y ) N μ ( x ; y ) = ( A - B + B - C + C - D + D - A ) × D ( x - y ) y μ u ( y ) d σ μ ( y ) .

Porém, BC está fora do cone de luz do ponto P, e a integral nessa superfície se anula, pois D(xy) tem suporte causal. Assim sendo, identificando a integral sobre AB como a solução da equação (128) e reconhecendo que os vetores normais às superfícies CD e DA são, respectivamente, nas coordenadas do plano nulo, (0;0;0; − 1) e (− 1; 0; 0; 0), obteremos que:

(132) u ( x ) = D - A D ( x - y ) - y u ( y ) d 2 y d y - + C - D D ( x - y ) + y u ( y ) d 2 y d y + ,

visto que a superfície DA é de x+ = constante e a CD é de x = constante. Isto é concordante com nossos estudos prévios: A solução ao problema de valores iniciais é única e bem definida se os dados iniciais são o valor do campo na superfície característica e o valor dele em uma superfície diferente da anterior. Em outras palavras, temos substituído o valor de u e ∂0u em um plano tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular, podemos fazer o limite em que a superfície CD se encontra em x → − ∞, e os dados iniciais nessa superfície são substituídos pela «condição assintótica» [14, 15]:

(133) lim x - - u ( x ) = 0 .

Em tal caso, a solução da equação (132) se simplifica a:

(134) u ( x ) = y + = y 0 + D ( x - y ) - y u ( y ) d 2 y d y - ,

que precisa do conhecimento só do valor do campo na superfície isocrônica x+=x0+.

4. Coordenadas invariantes do plano nulo

Como temos estabelecido, a relação entre uma forma dinâmica e outra vai além de uma simples transformação de coordenadas7: A verdadeira diferença fundamental é que com essa mudança temos um novo conjunto de dados iniciais, que evoluem causalmente de uma superfície para outra segundo os geradores dinâmicos da forma particular.

Assim, é possível usar, em qualquer forma dinâmica, qualquer conjunto de coordenadas. Por exemplo, é perfeitamente possível usar coordenadas no plano nulo e ainda assim estar na dinâmica instantânea, se os dados iniciais fossem dados numa superfície de x0 constante. Isto porque, já vimos na seção 2 2. Definição algébrica das formas dinâmicas Nessa seção introduziremos as diversas formas dinâmicas seguindo as idéias apresentadas por Dirac [6], que colocou o problema da seguinte forma: Duas teorias, a relatividade de Poincaré-Einstein, que exige a invariância da física frente às transformações do grupo de Poincaré, e a mecânica quântica, cuja estrutura é hamiltoniana,4 passaram por importantes provas experimentais. Quais serão as condições gerais que permitem a descrição de um sistema físico compatível com esses dois requerimentos simultâneamente? Comecemos com a imposição da possibilidade da formulação hamiltoniana. Essa formulação se equivale com o formalismo dos colchetes de Poisson [48, 49], segundo o qual variáveis dinâmicas quaisquer, ξ, η e ζ, devem ter colchetes de Poisson regidos pelas leis: (1) { ξ ; η } = - { η ; ξ } , (2) { ξ ; η + ζ } = { ξ ; η } + { ξ ; ζ } , (3) { ξ ; η ζ } = { ξ ; η } ζ + η { ξ ; ζ } , (4) { { ξ ; η } ; ζ } + { { η ; ζ } ; ξ } + { { ζ ; ξ } ; η } = 0 . Mas as variáveis dinâmicas estão definidas em relação ao sistema das coordenadas –exemplo disto são as próprias coordenadas e os momentos–, de forma que aquelas mudam quando essas são submetidas a uma transformação. Sob a transformação infinitesimal das coordenadas, cada variável dinâmica ξ transforma-se segundo: (5) ξ ′ = ξ + { ξ ; F } , com F alguma variável dinâmica infinitesimal, dependente apenas do sistema envolvido e da transformação de coordenadas, e ao que se dá o nome de «gerador da transformação». Essa forma da variação garante que as relações entre os colchetes de Poisson das diversas variáveis dinâmicas permaneçam inalteradas, o que permite cumprir a exigência da teoria da relatividade: «Sob as transformações do grupo de Poincaré, as variações das variáveis dinâmicas devem ser tais que os colchetes de Poisson entre elas permaneçam os mesmos». Assim, se faz necessário examinar os geradores das transformações de Poincaré. Uma transformação infinitesimal de Poincaré muda as coordenadas segundo: (6) x ′ ⁣ μ = x μ + a μ + b ⁢ x ν ν μ , com aμ os parâmetros infinitesimais da translação e bμν = − bνμ os parâmetros infinitesimais associados à transformação de Lorentz. Mantendo a discussão em nível infinitesimal, o gerador F deverá também ser linear nestes parâmetros: (7) F = - P μ ⁢ a μ + 1 2 ⁢ M μ ⁢ ν ⁢ b μ ⁢ ν ; M μ ⁢ ν = - M ν ⁢ μ . A dependência com a transformação está inclusa nos parâmetros a e b; logo as variáveis dinâmicas P e M caracterizam o sistema em estudo. Elas se chamam «quantidades fundamentais», e estão sujeitas à álgebra do grupo de Poincaré, como o demonstramos no apêndice A: (8) { P μ ; P ν } = 0 , (9) { M μ ⁢ ν ; P ρ } = - g μ ⁢ ρ P ν + g ν ⁢ ρ P μ , (10) { M μ ⁢ ν ; M ρ ⁢ σ } = - g μ ⁢ ρ M ν ⁢ σ + g ν ⁢ ρ M μ ⁢ σ - g μ ⁢ σ M ρ ⁢ ν + g ν ⁢ σ ⁢ M ρ ⁢ μ . Neste ponto, Dirac introduz a noção do que sejam as formas dinâmicas: Elas são as soluções para as relações algébricas que acabamos de escrever. Para entender o que isto quer dizer, lembre o leitor que nem todas as transformações do grupo de simetrias do espaço-tempo levam à evolução dinâmica das superfícies isocrônicas; na teoria newtoniana, por exemplo, em que o grupo de simetrias é o grupo de Galilei, uma translação espacial ou uma rotação não muda a superfície de tempo constante, apenas a transforma em si mesma, são «transformações cinemáticas» e a superfície isocrônica é estável em relação a elas. O mesmo ocorre na teoria relativística: Alguns dos geradores darão lugar a transformações cinemáticas e constituirão o «grupo de estabilidade» das superfícies isocrônicas, mapeando estas em si mesmas; os outros geradores levam a transformações que mudam a superfície, a fazem evoluir, e assim devem ser identificados com as transformações dinâmicas; a estes geradores Dirac dá o nome de «hamiltonianos». A partir daqui, já é evidente que o grupo de estabilidade e os hamiltonianos dependerão de qual seja a superfície isocrônica escolhida, e daí o interesse nas diversas formas dinâmicas: Pode acontecer –como de fato acontece, segundo comentamos na seção 1– que para alguns problemas a descrição da dinâmica seja simplificada em uma determinada forma dinâmica, pois os hamiltonianos podem ser mais simples ou mais complicados segundo a escolha da superfície isocrônica. Se tais grupos de estabilidade não são isomórficos, então as formas dinâmicas que lhes correspondem não poderão ser deformadas uma na outra por uma simples transformação de Poincaré; em tais situações, que são precisamente as que definem formas dinâmicas «diferentes», a equivalência física da descrição não se deriva do axioma da relatividade: Esse é o problema da equivalência. Para relacionar as superfícies isocrônicas com seu grupo de estabilidade, as descreveremos por meio de uma função Σ = Σ(x) cujo valor é constante nas superfícies, ou seja, ele é a expressão do «tempo» da forma dinâmica. Os geradores do grupo de estabilidade serão aqueles que satisfaçam: (11) { Σ ⁢ ( x ) ; F } = 0 , pois assim sendo, segundo a equação (5), a transformação gerada por F deixa invariante o valor do tempo Σ. Os geradores que não satisfazem à equação (11), por outra parte, serão os geradores da dinâmica. O colchete da equação (11) pode ser calculado uma vez que seja conhecida a função Σ(x) pelo uso das equações (292). Forma instantânea. Nessa forma dinâmica as superfícies isocrônicas são aquelas em que a coordenada x0 se mantém constante: (12) Σ ⁢ ( x ) = x 0 . Usando as equações (292) vemos que: (13) { x 0 ; P ρ } = - δ ρ 0 , { x 0 ; M ρ ⁢ σ } = δ ρ 0 ⁢ x σ - δ σ 0 ⁢ x ρ . O grupo de estabilidade dessas superfícies espaciais contém, como na física newtoniana, as translações e rotações espaciais, correspondentes aos geradores P1, P2, P3, M12, M23 e M31, que são, então, os geradores cinemáticos da forma instantânea. Que eles constituem uma sub-álgebra do grupo de Poincaré –e então dão origem a um de seus subgrupos– pode ser diretamente verificado com o uso das equações (8)–(10): Todos os colchetes de Poisson desses geradores têm por resultado uma expressão que contém a eles mesmos só. Os outros geradores, a saber, P0, M10, M20 e M30, são os geradores dinâmicos ou hamiltonianos. Assim, o grupo de estabilidade da forma instantânea tem dimensão sêis, e possui quatro hamiltonianos. Forma-ponto. Na forma-ponto o tempo é dado pela função: (14) Σ ⁢ ( x ) = x μ ⁢ x μ . Calculando a ação dos geradores das transformações de Poincaré sobre ela: (15) { x μ ⁢ x μ ; P ρ } = - 2 ⁢ x ρ , { x μ ⁢ x μ ; M ρ ⁢ σ } = 0 . Portanto, o grupo de estabilidade é constituído pelas transformações geradas por Mμν e tem dimensão seis, ao passo que os geradores Pμ serão os quatro hamiltonianos da forma dinâmica. Embora sejam em número igual que na forma instantânea, a forma-ponto possui a vantagem de apresentar hamiltonianos que compõem um tetra-vetor, podendo ser tratados como uma única entidade covariante. A nomeação de «forma-ponto» dada a essa dinâmica é devida à seguinte propriedade: Que seu grupo de estabilidade é o grupo de rotações tetra-dimensionais ao redor de um ponto fixo. Forma da frente de luz. Nesta forma dinâmica a superfície isocrônica é a superfície de valor constante do tempo (16) Σ ⁢ ( x ) = x + = 1 2 ⁢ ( x 0 + x 3 ) . Para ela obtemos que: (17) { x + ; P ρ } = - δ ρ + , { x + ; M ρ ⁢ σ } = δ ρ + ⁢ x σ - δ σ + ⁢ x ρ . Ocorre aqui algo curioso: Somente se a superfície for a x+ = 0, o colchete de Poisson {x+; M+ −} se anula, como se observa da equação (17). M+ −, portanto, forma parte do grupo de estabilidade da superfície x+ = 0, mas não das superfícies correspondentes a outros tempos. Restringindo nossa atenção a essa superfície particular, que sempre pode ser usada como a superfície inicial no problema de valores iniciais, teremos que o grupo de estabilidade tem dimensão sete e é formada pelos geradores P1, P2, P−, M12, M1 − , M2 − e M+ −. O número de hamiltonianos é três, e são P+, M1 + e M2 + . Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler e Stern a superfície isocrônica é definida pelo tempo: (18) Σ ⁢ ( x ) = ( x 0 ) 2 - ( x 1 ) 2 - ( x 2 ) 2 = x μ ⁢ x μ + ( x 3 ) 2 . A ação dos geradores do grupo de Poincaré sobre ela é: (19) { x μ ⁢ x μ + ( x 3 ) 2 ; P ρ } = - 2 ⁢ x ρ - 2 ⁢ x 3 ⁢ δ ρ 3 , { x μ ⁢ x μ + ( x 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ x 3 ⁢ ( δ ρ 3 ⁢ x σ - δ σ 3 ⁢ x ρ ) . Vemos assim que o grupo de estabilidade tem apenas dimensão quatro, e a ele correspondem os geradores P3, M01, M02 e M12. Os hamiltonianos dessa forma dinâmica são seis: P0, P1, P2, M03, M13 e M23. Forma de Leutwyler-Stern 2. A segunda forma introduzida por Leutwyler e Stern possui o tempo definido segundo a função: (20) Σ ⁢ ( x ) = ( x 0 ) 2 - ( x 3 ) 2 . Com o uso das equações (292) obtemos que: (21) { ( x 0 ) 2 - ( x 3 ) 2 ; P ρ } = - 2 ⁢ x 0 ⁢ δ ρ 0 + 2 ⁢ x 3 ⁢ δ ρ 3 , { ( x 0 ) 2 - ( x 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ x 0 ⁢ ( δ ρ 0 ⁢ x σ - δ σ 0 ⁢ x ρ ) - 2 ⁢ x 3 ⁢ ( δ ρ 3 ⁢ x σ - δ σ 3 ⁢ x ρ ) . Com esses resultados podemos estabelecer que o grupo de estabilidade das superfícies de Σ constante é aquele correspondente aos geradores P1, P2, M12 e M03, e portanto tem dimensão quatro. Os seis hamiltonianos dessa forma dinâmica serão os geradores P0, P3, M01, M02, M13 e M23. E isso esgota as possibilidades, uma vez que não há outro subgrupo do grupo de Poincaré com a propriedade da transitividade que possa servir como grupo de estabilidade de alguma outra superfície [9, 10, 11, 12, 13]. Os resultados que assim obtivemos da classificação algébrica das cinco possíveis formas dinâmicas na teoria relativística se resumem na tabela 1. Como podemos ver, a dinâmica da frente de luz ocupa um lugar destacado por ser a forma dinâmica com o maior grupo de estabilidade e, consequentemente, aquele com o menor número de hamiltonianos. Tabela 1 Resumo das cinco formas dinâmicas da teoria relativística. D(GΣ): Dimensão do grupo de estabilidade GΣ; N. de H’s: Número de hamiltonianos. F. dinâmica Σ(x) D(GΣ) N. de H’s Instantânea x 0 6 4 Forma-ponto x μ x μ 6 4 Frente de luz x + 7 3 L-S 1 xμxμ + (x3)2 4 6 L-S 2 (x0)2 − (x3)2 4 6 2.1. Mecânica do ponto material Uma primeira solução, a mais simples, às equações (8)–(10) é obtida na mecânica do ponto material: (22) P μ = p μ , M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ , com as coordenadas qμ e momentos pμ da partícula sujeitos a: (23) { q μ ; q ν } = 0 , { p μ ; p ν } = 0 , { p μ ; q ν } = g μ ⁢ ν . Desejamos em cada forma dinâmica escrever expressões para esses geradores sobre a superfície inicial (isocrônica). Para isto será necessário incorporar as equações que determinam tal superfície como equações subsidiárias, do tipo: (24) A ≈ 0 . Mas as condições subsidiárias devem permanecer tais frente a qualquer mudança do sistema de coordenadas, o que implica que devam também ser condições subsidiárias: (25) { A ; P ρ } ≈ 0 , { A ; M ρ ⁢ σ } ≈ 0 . Para eliminar as variáveis cujo significado é perdido ao fixar a superfície inicial, usaremos a condição de camada de massa, p2 − m2 = 0, mas a introduziremos nos geradores do grupo de Poincaré usando coeficientes indeterminados (multiplicadores de Lagrange); as equações (22) serão substituídas por: (26) P μ = p μ + λ μ ⁢ ( p 2 - m 2 ) , (27) M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ + λ μ ⁢ ν ⁢ ( p 2 - m 2 ) , com λμν = − λνμ. Tais coeficientes serão determinados pela imposição da equação (25). Forma instantânea. Temos a condição subsidiária: (28) q 0 ≈ 0 . A anulação do seu colchete de Poisson com o gerador Pμ somente acontece se: (29) { q 0 ; P σ } = - δ σ 0 - 2 ⁢ λ σ ⁢ p 0 ≈ 0 , enquanto a equação correspondente às transformações de Lorentz é: (30) { q 0 ; M ρ ⁢ σ } = - q ρ ⁢ δ σ 0 + q σ ⁢ δ ρ 0 - λ ρ ⁢ σ ⁢ 2 ⁢ p 0 ≈ 0 . Das equações (29) e (30) decorrem os valores: (31) λ 0 = - 1 2 ⁢ p 0 , λ r = 0 , λ r ⁢ 0 = - q r 2 ⁢ p 0 , λ r ⁢ s = 0 , r, s = 1, 2, 3. Os geradores na superfície inicial são portanto: (32) P 0 = p 2 + m 2 , P r = p r , (33) M r ⁢ 0 = q r ⁢ p 2 + m 2 , M r ⁢ s = q r ⁢ p s - q s ⁢ p r . Temos usado aqui a notação p2=p12+p22+p32. Forma-ponto. A condição subsidiária nessa forma dinâmica é: (34) q μ ⁢ q μ ≈ κ 2 = constante . Essa constante em geral será não nula; porém, ela pode também ser nula, caso em que o hiperboloide degenera no cone de luz. As condições da equação (25) são assim: (35) { q μ ⁢ q μ ; P ρ } = - 2 ⁢ q ρ - 4 ⁢ λ ρ ⁢ q ⋅ p ≈ 0 , (36) { q μ ⁢ q μ ; M ρ ⁢ σ } = - 4 ⁢ λ μ ⁢ ν ⁢ q ⋅ p ≈ 0 . Dessas equações, obtemos o valor dos coeficientes indeterminados: (37) λ ρ = - q ρ 2 ⁢ q ⋅ p , λ μ ⁢ ν = 0 , e assim também o dos geradores do grupo de Poincaré: (38) P μ = p μ - q μ ⁢ ( p 2 - m 2 ) 2 ⁢ q ⋅ p , (39) M μ ⁢ ν = q μ ⁢ p ν - q ν ⁢ p μ . Forma da frente de luz. A condição subsidiária consiste, dessa vez, na especificação do plano nulo inicial: (40) q + ≈ 0 . Agora temos as restrições: (41) { q + ; P ρ } = - δ ρ + - 2 ⁢ λ ρ ⁢ p - ≈ 0 , (42) { q + ; M ρ ⁢ σ } = δ ρ + ⁢ q σ - δ σ + ⁢ q ρ - 2 ⁢ λ ρ ⁢ σ ⁢ p - ≈ 0 . Delas obtemos os multiplicadores –usamos i, j = 1, 2–: (43) λ + = - 1 2 ⁢ p - , λ i = 0 = λ - , λ + - = 0 , λ i + = - q i 2 ⁢ p - , λ i ⁢ j = 0 , λ i - = 0 . E, daqui, os geradores do grupo de Poincaré no plano nulo x+ = 0 são: (44) P + = p ⟂ 2 + m 2 2 ⁢ p - , P - = p - , P i = p i , (45) M i + = q i ⁢ p ⟂ 2 + m 2 2 ⁢ p - - q + ⁢ p i , M + - = q + ⁢ p - , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , M i - = q i ⁢ p - . Nestas expressões: p⟂2=p12+p22. Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler-Stern a condição subsidiária imposta às coordenadas da partícula é: (46) q μ ⁢ q μ + ( q 3 ) 2 ≈ κ 2 = constante . Encontramos as seguintes condições adicionais: (47) { q μ ⁢ q μ + ( q 3 ) 2 ; P ρ } = - 2 ⁢ q ρ - 2 ⁢ q 3 ⁢ δ ρ 3 - 4 ⁢ λ ρ ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) ≈ 0 , (48) { q μ ⁢ q μ + ( q 3 ) 2 ; M ρ ⁢ σ } ⁢ 2 ⁢ q 3 ⁢ ( δ ρ 3 ⁢ q σ - δ σ 3 ⁢ q ρ ) - 4 ⁢ λ μ ⁢ ν ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) ≈ 0 , das quais podemos isolar os coeficientes indeterminados: λ 0,1,2 = - q 0,1,2 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) , λ 3 = 0 , λ 01 = λ 02 = λ 12 = 0 , λ ( 0,1,2 ) ⁢ 3 = - q 0,1,2 ⁢ q 3 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) . As quantidades fundamentais nesta forma dinâmica são portanto: (49) P 0,1,2 = p 0,1,2 - q 0,1,2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) , P 3 = p 3 , M 01 = q 0 ⁢ p 1 - q 1 ⁢ p 0 , M 02 = q 0 ⁢ p 2 - q 2 ⁢ p 0 , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , (50) M ( 0,1,2 ) ⁢ 3 = q 0,1,2 ⁢ p 3 - q 3 ⁢ p 0,1,2 - q 0,1,2 ⁢ q 3 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q μ ⁢ p μ + q 3 ⁢ p 3 ) . Forma de Leutwyler-Stern 2. Nesta última forma dinâmica a condição subsidiária adota a forma: (51) ( q 0 ) 2 - ( q 3 ) 2 ≈ κ 2 = constante . As condições que tal restrição implica são as que seguem: (52) { ( q 0 ) 2 - ( q 3 ) 2 ; P ρ } = - 2 ⁢ q 0 ⁢ δ ρ 0 + 2 ⁢ q 3 ⁢ δ ρ 3 - 4 ⁢ λ ρ ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) ≈ 0 , (53) { ( q 0 ) 2 - ( q 3 ) 2 ; M ρ ⁢ σ } = 2 ⁢ q 0 ⁢ ( δ ρ 0 ⁢ q σ - δ σ 0 ⁢ q ρ ) - 2 ⁢ q 3 ⁢ ( δ ρ 3 ⁢ q σ - δ σ 3 ⁢ q ρ ) - 4 ⁢ λ ρ ⁢ σ ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) ≈ 0 . Desse sistema, obtemos os valores dos multiplicadores de Lagrange: λ 0 = - q 0 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 1, 2 = 0 , λ 3 = q 3 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 0 ⁢ ( 1, 2 ) = q 0 ⁢ q 1, 2 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , λ 03 = 0 , λ 12 = 0 , λ ( 1, 2 ) ⁢ 3 = q 3 ⁢ q 1, 2 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) . Os geradores ficam da seguinte forma: (54) P 0 = p 0 - q 0 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , P 1, 2 = p 1, 2 , P 3 = p 3 + q 3 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , (55) M 0 ⁢ ( 1, 2 ) = q 0 ⁢ p 1, 2 - q 1, 2 ⁢ p 0 + q 0 ⁢ q 1, 2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) , M 03 = q 0 ⁢ p 3 - q 3 ⁢ p 0 , M 12 = q 1 ⁢ p 2 - q 2 ⁢ p 1 , M ( 1, 2 ) ⁢ 3 = q 1, 2 ⁢ p 3 - q 3 ⁢ p 1, 2 + q 3 ⁢ q 1, 2 ⁢ ( p 2 - m 2 ) 2 ⁢ ( q 0 ⁢ p 0 - q 3 ⁢ p 3 ) . Como podemos observar, em todas as formas dinâmicas os geradores do grupo de estabilidade da superfície inicial não são modificados pela restrição a ela, mas somente os hamiltonianos o são, em correspondência com a sua ação. Poderemos nos perguntar agora, nesta situação que é ainda a mais simples possível, que é a do ponto material livre, qual é a forma dinâmica que se apresenta mais vantajosa? Olhando para as expressões que acabamos de escrever para os hamiltonianos, é claro que as formas de Leutwyler-Stern não o serão, não já somente pela complexidade de seus hamiltonianos, mas também pelo fato de serem seis deles. A forma instantânea, muito usada, apresenta a dificuldade de uma raíz quadrada; em relação a este ponto, lembre o leitor a impossibilidade de escrever a equação de Klein-Gordon-Fock na forma hamiltoniana na classe dos operadores diferenciais; isto último somente é possível ao ampliar dita classe e considerar os operadores pseudo-diferenciais –o leitor interessado pode consultar a Ref. [50]–. Semelhante dificuldade é evitada na forma-ponto e na forma da frente de luz, que se mostram assim muito convenientes. Já indicamos anteriormente uma vantagem importante da forma-ponto, que é o fato de seus hamiltonianos constituirem um tetra-vetor: A covariância é fácilmente implementada nessa forma dinâmica. No entanto, na expressão de seus hamiltonianos aparece sempre o produto q⋅ p no denominador, o que faz com que eles sejam complicados. Comparativamente, na forma do plano nulo, além de ser aquela em que o número de hamiltonianos é menor, eles têm também uma forma bastante simples; e em adição seu hamiltoniano P+, associado à energia, depende única e exclusivamente dos momentos, a posição não aparece nele, diferentemente da forma-ponto. Convencidos por estes motivos do interesse da forma dinâmica da frente de luz, passaremos a considerar já não a mecânica do ponto, mas os campos clássicos construidos nela. , uma transformação das coordenadas não implica uma transformação da superfície inicial. Por isso, para recuperar a covariância da teoria e assim explicitar que o sistema de coordenadas nada tem a ver com a forma dinâmica, Rohrlich [14, 15] introduziu um conjunto de campos vetoriais, tais que seja sempre possível levar as quantidades covariantes à forma «própria» do plano nulo. Consideremos um sistema inercial de referência; ele define sua origem O e seus eixos cartesianos instantâneos segundo a escolha de quatro campos vetoriais e~(0), e~(1), e~(2) e e~(3), tais que as coordenadas cartesianas instantâneas de um ponto P qualquer são obtidas por projeção8:

(135) x ( a ) ( P ) = : O P e ~ d μ ( a ) x μ ; ( a ) = ( 0 ) , ( 1 ) , ( 2 ) , ( 3 ) ,

expressão esta que é invariante frente a qualquer substituição das coordenadas. Portanto, uma transformação de coordenadas muda xμ, e, claro, as componentes e~μ(a), mas o campo vetorial e~(a), assim como as coordenadas x(a), se mantêm as mesmas. Uma transformação de sistema de referência muda os campos vetoriais e~(a) e, em consequência, as coordenadas x(a). Os campos e~(a) são chamados «campos de tétradas», e as coordenadas x(a), «coordenadas invariantes». Mais em geral, também outras grandezas podem ser projetadas com o campo de tétradas para obter sua forma invariante. Em particular, a métrica gμν se relaciona com a métrica invariante η~(a)(b) por:

(136) g μ ν ( x ) e ~ ( x ) ( a ) μ e ~ ( x ) ( b ) ν = η ~ ( a ) ( b ) ,

ou, inversamente:

(137) η ~ ( a ) ( b ) ( x ) e ~ ( x ) μ ( a ) e ~ ( x ) ν ( b ) = g μ ν .

Agora, como já mencionado (vide a Ref. [55]): « […] a eleição da base de tétradas depende das simetrias subjacentes do espaço-tempo e é, em boa medida, parte do problema» . É claro, quando o autor se refere às «simetrias do espaço-tempo», devemos entender que entre elas estão também as simetrias do problema a se resolver. E como temos insistido em que alguns problemas se simplificam com o uso da forma dinâmica do plano nulo, algumas vezes será vantajoso escolher a base de tétradas obtida, exigindo que a métrica invariante dessa dinâmica seja igual à métrica nesse conjunto de coordenadas [vide a equação (127)]:

(138) [ η ( a ) ( b ) ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) .

Porém, as componentes do tensor métrico gμν dependem unicamente do sistema de coordenadas, e não da base de tétradas, de forma que, se denotarmos por e(+), e(1), e(2) e e(− ) os campos de tétradas correspondentes ao plano nulo, então:

(139) e ~ e ~ μ ( 0 ) - ν ( 0 ) e ~ e ~ μ ( 1 ) - ν ( 1 ) e ~ e ~ μ ( 2 ) - ν ( 2 ) e ~ e ~ μ ( 3 ) = ν ( 3 ) g μ ν = e e μ ( + ) + ν ( - ) e e μ ( - ) - ν ( + ) e e μ ( 1 ) - ν ( 1 ) e e μ ( 2 ) , ν ( 2 )

e uma solução é9:

(140) e ( + ) = 1 2 ( e ~ ( 0 ) + e ~ ( 3 ) ) , e ( - ) = 1 2 ( e ~ ( 0 ) - e ~ ( 3 ) ) , e ( 1 ) = e ~ ( 1 ) , e ( 2 ) = e ~ ( 2 ) .

E, correspondentemente:

(141) e ( + ) = 1 2 ( e ~ ( 0 ) + e ~ ( 3 ) ) , e ( - ) = 1 2 ( e ~ ( 0 ) - e ~ ( 3 ) ) , e ( 1 ) = e ~ ( 1 ) , e ( 2 ) = e ~ ( 2 ) .

Os campos de tétradas da dinâmica da frente de luz, por sua definição, apresentam as seguintes propriedades –usaremos doravante α, β = 1, 2–:

(142) e ( + ) e ( + ) = 0 = e ( - ) e ( - ) , e ( + ) e ( - ) = 1 , e ( α ) e ( β ) = - δ α β , e ( + ) e ( α ) = 0 = e ( - ) e ( α ) .

Particularmente, é fácil verificar que quando as tétradas assumem seus valores canônicos, isto é, com componentes e(+) = (1;0;0;0), e(1) = (0;1;0;0), e(2) = (0;0;1;0) e e(− ) = (0;0;0;1), então, a métrica gμν se iguala com a métrica invariante: [gμν] = [η(a)(b)] dada na equação (138), o que significa que as coordenadas invariantes coincidem com as coordenadas no plano nulo, como deve ser por consistência.

Sendo o conjunto {e(a)} (a = + ,1, 2, − ) uma base do espaço-tempo de Minkowski, podemos decompor qualquer vetor A como combinação linear de seus elementos. Escrevemos: A=(a)A(a)e(a). Multiplicando por um elemento da base dual –base de co-tétradas– e(b):

e ( b ) A = ( a ) A ( a ) e ( b ) e ( a ) = ( a ) A ( a ) δ = ( a ) ( b ) A ( b ) .

Portanto, o vetor A tem componentes invariantes:

(143) A ( + ) := A e ( + ) , A ( α ) := A e ( α ) , A ( - ) := A e ( - ) ,

e decomposição na base de tétradas:

(144) A = A ( + ) e ( + ) + A ( ) e ( ) + A ( - ) e ( - ) ,

com: A()e()α=12A(α)e(α). O produto escalar de dois vetores A e B pode ser escrito agora em função de suas componentes invariantes no plano nulo:

(145) A B = A ( + ) B ( - ) + A ( - ) B ( + ) - A ( ) B ( ) .

Em particular, o vetor posição10 x tem decomposição: x = x(+)e(+) + x(− )e(− ) + x(⊥)e(⊥), e também o operador derivada: ∂ = e(+)(−) + e(− )(+)e(⊥)(⊥), cujas componentes invariantes são dadas pela definição de derivadas direcionais:

(146) ( + ) = e ( + ) = ( e ( - ) x ) = x ( + ) ,

e analogamente:

(147) ( - ) = e ( - ) = x ( - ) , ( ) = e ( ) = x ( ) .

Finalmente, como escolhemos a coordenada x(+) como o tempo na dinâmica da frente de luz, o vetor e(+) indicará a direção temporal nessa dinâmica, e ∂(+) será a derivada temporal. Cada plano nulo de x(+) = constante é gerado pelos três vetores e(⊥) e e(− ), e tem elemento de volume que denotaremos por d3x¯:=dx(1)dx(2)dx(-)d2x()dx(-).

5. Formalismo lagrangiano e o primeiro teorema de Nöther

Uma vez estabelecidos todos os elementos necessários para estudar a física no plano nulo, fixaremos a consideração na teoria de campos clássicos, ou seja, à descrição ondulatória da partícula individual por suas equações de movimento, sem sujeitar ainda suas soluções aos axiomas da teoria quântica –isto é, desconsiderando as exigências da interpretação probabilística, a possibilidade de mudança do número e identidade das partículas, et cetera –.

Uma abordagem, quiçá a mais habitual para o estudo dos campos, é a abordagem lagrangiana. Como ela é bem conhecida e, por outra parte, existem excelentes referências para seu estudo –vide o leitor, por exemplo, as Refs. [53, 59, 60, 61]–, nos limitaremos aqui apenas a oferecer um brevíssimo resumo com o intuito de fixar a notação.

Seja uA(x) (A = 1,⋯, N) a componente A-ésima de um conjunto de N, definidas no espaço-tempo tetra-dimensional de Minkowski, 𝕄. Tais componentes são genéricas, isto é, podem pertencer a campos de diferente natureza. A integral de ação extendida à região espaço-temporal Ω, é definida como:

(148) 𝒜 [ u ] := Ω d 4 x [ u ; u ] ( x ) ,

com ℒ a densidade lagrangiana de primeira ordem, isto é, que depende das derivadas dos campos de até primeira ordem. Se aplicarmos uma transformação cujos efeitos nas coordenadas e campos são dados, infinitesimalmente, pelas equações:

(149) x μ = x μ + δ x μ , u A ( x ) = u A ( x ) + δ u A ( x ) ,

então, frente a essa transformação, a ação tem variação:

(150) δ 𝒜 [ u ] := Ω d 4 x [ u ; u ] ( x ) - Ω d 4 x [ u ; u ] ( x ) = Ω d 4 x ( δ + μ δ x μ ) .

Essa expressão pode ser escrita de forma conveniente definindo a derivada de Euler da densidade lagrangiana,

(151) δ δ u A := u A - μ ( μ u A ) ,

e a quantidade:

(152) Θ := ν μ ( μ u A ) ν u A - δ ν μ .

Então a equação (150) é equivalente a:

(153) δ 𝒜 [ u ] = Ω d 4 x { δ δ u A ( δ u A - μ u A δ x μ ) - μ [ Θ δ ν μ x ν - ( μ u A ) δ u A ] } .

Escrita nesta forma é possível a aplicação direta de princípios variacionais à integral de ação:

Princípio da ação estacionária(de Ostrogradskii-Hamilton): Campo físico é aquele cuja forma funcional (δxμ = 0) é tal que, entre duas configurações fixas do sistema (δuA(x)|∂Ω = 0), a integral de ação adota um valor estacionário (δ𝒜[u] = 0) qualquer que seja a região Ω.

As equações de Euler-Lagrange são consequência do princípio da ação estacionária, pois a equação (153) implica que:

(154) δ δ u A = 0 ; A = 1 , , N .

Primeiro teorema de Nöther:Se a integral de ação de um dado sistema físico é invariante, até termos de superfície, em relação a certo grupo de Lie Gr de r parâmetros, então r combinações linearmente independentes de derivadas de Euler da densidade lagrangiana são iguais a divergências.

Prova: Denotemos por ϵa (a = 1,⋯, r) os parâmetros do grupo Gr, e consideremos que a transformação age sobre as coordenadas e campos mediante as representações Xa e Ia, respectivamente; ou seja:

(155) δ x μ = ϵ a [ X a x ] μ , δ u A = ϵ a [ I a u ] A .

Por hipótese do teorema, a ação é invariante, até termos de superfície, frente às transformações da equação (155): Ωd4xμ(ϵaδaΩμ). Portanto, na equação (153):

(156) Ω d 4 x { δ δ u A ( [ I a u ] A - μ u A [ X a x ] μ ) - μ J } a μ ϵ a = 0 ,

com:

(157) J := a μ Θ [ X a x ] ν ν μ - ( μ u A ) [ I a u ] A - δ a Ω μ .

Ora a independência linear dos parâmetros do grupo Gr, ϵa, nos permite escrever a tese do teorema:

(158) δ δ u A ( [ I a u ] A - μ u A [ X a x ] μ ) = μ J ; a μ a = 1 , , r ,

quod erat demonstrandum . ■

Para campos físicos, as identidades da equação (158) se tornam r leis de conservação das densidades de corrente Jaμ, pois o lado esquerdo delas se anula por ser proporcional às equações de Euler-Lagrange. Como elas regem apenas sob a imposição dos campos serem físicos, a elas se chama «leis de conservação débeis». Neste caso, as correspondentes cargas conservadas, chamadas «cargas de Nöther», são obtidas por integração da densidade de corrente sobre uma superfície Σ com elemento de área d3σμ = d3σnμ, com nμ o vetor normal a Σ:

(159) Q a := Σ d 3 σ ( x ) n μ J ( x ) a μ .

Na dinâmica da frente de luz, a superfície Σ é o plano nulo x(+)=x0(+)=constante. Este plano é, como já foi observado, gerado pelos vetores e(⊥) e e(− ), e, portanto, tem vetor normal n = e(− ), ortogonal a eles [note que o vetor e(+), que poderíamos pensar inicialmente que fosse o vetor normal, falha, pois não é ortogonal a e(− ), segundo a equação (142)]. Substituindo na equação (159):

(160) Q a = x ( + ) = x 0 ( + ) d 3 x ¯ e ( - ) μ J ( x ) a μ = x ( + ) = x 0 ( + ) d 3 x ¯ J ( x ) a ( + ) ;
(161) d Q a d x ( + ) = 0 .

Tipicamente, as densidades de corrente são formas bilineares dos campos, então as cargas de Nöther existirão (a integral que as define será convergente) se os campos, assim como suas derivadas transversais e longitudinal, são de quadrado integrável no plano nulo. Essas condições assintóticas requeridas para a existência das cargas de Nöther, vemos, incluem a condição assintótica da equação (133) que substituia os dados iniciais na superfície característica x(− ) = constante.

Consideremos, particularmente, o gerador das translações temporais no plano nulo, isto é, o hamiltoniano. Consideremos a seguinte translação em forma covariante: x′⁣ μ = xμ + ϵμ, u′⁣ A(x′) = uA(x), ou:

(162) [ X ν x ] μ = δ , ν μ [ I ν u ] A = 0 .

Também, como a densidade lagrangiana é escalar frente a transformações do grupo de Poincaré, teremos que δℒ = 0. Isto na equação (150) implica que a integral de ação é invariante sob translações, pois os parâmetros ϵμ são constantes, e assim δνΩμ = 0. Substituindo a equação (162) na equação (157), obtemos a densidade de corrente conservada:

(163) J = ν μ Θ [ X ν x ] σ σ μ = Θ , ν μ

que é chamada «tensor de energia-momento». A carga de Nöther que lhe corresponde, com respeito ao plano nulo, é o «vetor de energia-momento» com componentes [vide a equação (160)]:

(164) P ν = x ( + ) = x 0 ( + ) d 3 x ¯ Θ . ν ( + )

As componentes invariantes desse vetor são obtidas projetando seu índice ν com o campo de tétradas da dinâmica da frente de luz:

(165) P ( a ) = e P ν ( a ) ν = d 3 x ¯ e Θ ( a ) ν = ν ( + ) d 3 x ¯ Θ . ( a ) ( + )

Assim, o momento invariante no plano nulo é:

(166) P ( ) = d 3 x ¯ Θ , ( ) ( + ) P ( - ) = d 3 x ¯ Θ , ( - ) ( + )

enquanto que o hamiltoniano invariante tem expressão:

(167) H P N P ( + ) = d 3 x ¯ Θ ( + ) ( + ) = d 3 x ¯ Θ ( - ) ( + ) .

E sobre a teoria lagrangiana geral do campo clássico basta o que foi dito. O segundo teorema de Nöther, referente à localização das simetrias, isto é, à ampliação do grupo de simetrias Gr que se obtém ao fazer os parâmetros do grupo depender do ponto x do espaço-tempo, leva imediatamente às teorias de calibre e, assim, aos campos em interação. Isto o deixamos para um próximo trabalho. Focaremos nossa atenção agora em estudar os diversos campos particulares usados na modelagem da matéria. E uma vez clara a ideia subjacente às coordenadas invariantes, deixaremos de escrever os índices entre parênteses.

6. Campo escalar

Seja (φ, φ) um campo escalar complexo, cujas equações de movimento são as de Klein-Gordon-Fock:

(168) ( + m 2 ) φ ( x ) = 0 ; ( + m 2 ) φ * ( x ) = 0 .

Como não há outras equações além dessas, o problema de Goursat para o campo escalar é simplesmente aquele que já estudamos na seção 3 3. Forma dinâmica do plano nulo e campos clássicos A discussão que acabamos de fazer a respeito da possibilidade de definir novas formas dinâmicas tem sido baseada na álgebra do grupo de Poincaré e exemplificada na mecânica do ponto material. E para tal, foi suficiente exigir a descrição unívoca de sua linha de mundo. No entanto, na teoria de campos isto não é suficiente, e devemos nos ocupar também da unicidade da descrição da evolução do campo, isto é, do problema de valores iniciais para as diferentes equações do campo. Com efeito: A estrutura causal da teoria da relatividade implica que o valor adotado pelo campo em cada ponto do espaço-tempo depende dos valores que ele tem adotado no cone de luz passado correspondente a tal ponto; donde a inicialização dos valores do campo em uma superfície isocrônica requer conhecer os valores do campo na interseção do referido cone de luz passado e a superfície inicial. Isto é mostrado para as três formas dinâmicas de Dirac na figura 3. Mas logo percebemos uma dificuldade na forma dinâmica do plano nulo: Enquanto que a interseção é uma região finita na forma instantânea e na forma-ponto, ela é uma região infinita na forma do plano nulo. Sendo assim, o problema dos valores iniciais no plano nulo não poderá ser abordado como uma simples transformação do problema de Cauchy, mas precisa ser estudado independentemente. Eis o objetivo da presente seção. Figura 3 Problema dos valores iniciais: (a) Na dinâmica instantânea, (b) na dinâmica forma-ponto, (c) na dinâmica da frente de luz. Na teoria relativística, a invariância sob translações implica que a equação que governa todas as componentes u(x) de todos os campos é a equação de Klein-Gordon-Fock: (56) ( □ + m 2 ) ⁢ u ⁢ ( x ) = 0 . Qualquer relação adicional entre as diferentes componentes de um mesmo campo constitui uma relação de vínculo, mas ela não impede o cumprimento da equação (56) –um caso especial, que pareceria contradizer o dito e que contudo não o faz, é o do campo eletromagnético, que estudaremos na seção 8–. Lembremos ao leitor que a obtenção dessa equação obedece ao fato de que os campos se transformam por representações do grupo de Poincaré, um de cujos operadores de Casimir é o quadrado do operador de momento: P2, então proporcional à identidade (com fator de proporcionalidade que temos denotado por m2), como o assegura o lema de Schur. Determinar quais dados são os que se precisa conhecer para poder antecipar o valor do campo em um ponto futuro é o problema dos valores iniciais, que para equações diferenciais de segunda ordem pode ser precisamente formulado da seguinte forma [51]: Problema dos valores iniciais: Seja (57) ϕ ( u ; x i ; ∂ ⁡ u ∂ ⁡ x i ; ∂ 2 ⁡ u ∂ ⁡ x i 2 ; ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k ) = 0 ( i = 1 , ⋯ , m ) uma equação diferencial parcial de segunda ordem, linear em u e suas derivadas com coeficientes que são funções quaisquer das variáveis xi. O problema dos valores iniciais com respeito à «superfície inicial» xm = 0 consiste em encontrar uma solução sujeita aos «dados iniciais»: (58) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) , ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . □ É claro, toda equação diferencial, quer ordinária, quer parcial, admite um número infinito de soluções, que são escritas como uma «integral geral» contendo um determinado número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em seu enunciado um conjunto de condições adicionais –os dados iniciais– que visam determinar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possível com elas determinar uma e só uma solução, pois pode acontecer que os dados iniciais sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os elementos arbitrários. Assim, diremos que o problema dos valores iniciais está bem definido se ele (i) tem solução, e (ii) dita solução é única. 3.1. Problema de Cauchy-Kovalevskaya O caso mais famoso do problema dos valores iniciais é o «problema de Cauchy», que se caracteriza porque na equação diferencial a segunda derivada de u em relação à variável xm que define a superfície inicial xm = 0 possui um coeficiente não nulo. As condições sob as quais o problema de Cauchy está bem definido são estabelecidas no seguinte teorema, que apresentaremos para o caso de duas variáveis independentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–: Teorema de Cauchy-Kovalevskaya: Seja o problema de valores iniciais para a equação diferencial parcial de segunda ordem e duas variáveis (59) ϕ ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ x 2 ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) = 0 . Se acontece que (60) ∂ ⁡ ϕ ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x 2 ) ≠ 0 , de tal forma que podemos escrever a equação (59) na forma: (61) ∂ 2 ⁡ u ∂ ⁡ x 2 = f ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) , com f uma função holomórfica –isto é, analítica e regular– na vizinhança de x = 0, então o problema de Cauchy está bem definido para qualquer valor funcional dos dados de Cauchy: (62) u ⁢ ( 0 ; y ) = u 0 ⁢ ( y ) e ∂ ⁡ u ∂ ⁡ x ⁢ ( 0 ; y ) = u 1 ⁢ ( y ) . □ O leitor interessado nos detalhes técnicos desse teorema pode consultar as Refs. [51, 52]. O que aqui exporemos é a construção da solução, que tem como consequência direta a sua unicidade. Escrevamos a função incógnita u(x; y) como série de potências na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy: (63) u = u 0 + u 1 ⁢ x + ⋯ + u h h ! ⁢ x h + ⋯ ; u h = u h ⁢ ( y ) ≡ ∂ h ⁡ u ∂ ⁡ x h | x = 0 . Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1, portanto, devemos nos preocupar em encontrar uh para h ≥ 2 em função deles. Notando que, em geral: (64) ∂ h + k ⁡ u ∂ ⁡ x h ⁢ ∂ ⁡ y k | x = 0 = ∂ k ⁡ u h ∂ ⁡ y k , podemos obter a solução desejada com o seguinte conjunto de passos: Tomando x = 0 na equação (61) obtemos: (65) u 2 = f ⁢ ( u 0 ; 0 ; y ; u 1 ; ∂ ⁡ u 0 ∂ ⁡ y ; ∂ 2 ⁡ u 0 ∂ ⁡ y 2 ; ∂ ⁡ u 1 ∂ ⁡ y ) , o que significa que u2 está determinado pelo conhecimento de u0 e u1. O fato de aparecer também suas derivadas na equação (65) não é motivo de preocupação, pois elas estão tomadas em relação à variável y com x = 0, e, portanto, podem se obter dos dados de Cauchy. Derivemos agora a equação (61) em relação a x, então coloquemos x = 0; obteremos: (66) u 3 = ⁢ ∂ ⁡ f ∂ ⁡ u ⁢ u 1 + ∂ ⁡ f ∂ ⁡ x + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ x ) ⁢ u 2 + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ y ) ⁢ ∂ ⁡ u 1 ∂ ⁡ y + ⋯ + ∂ ⁡ f ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x ⁢ ∂ ⁡ y ) ⁢ ∂ ⁡ u 2 ∂ ⁡ y , todas essas derivadas tomadas nos argumentos de f na equação (65). Assim, a equação (66) diz que a função u3 está determinada pelos dados de Cauchy e a função u2 obtida com eles. Note também que a condição de f ser holomórfica na vizinhança de x = 0 tem sido usada para tomar sua derivada nesse ponto. Isto ocorre também nos seguintes termos na seqüência da equação (63), que são obtidos por derivação sucessiva da equação (61) em x = 0: o resultado será sempre que a função uh é um polinômio de u0, u1, …, uh − 1 e suas derivadas, assim como de f e suas derivadas tomadas nos argumentos da equação (65). Uma vez que conhecemos as funções uh, podemos expressá-las como séries de potências na variável y ao redor do valor y0 fixo: (67) u h ⁢ ( y ) = ∑ k u h ⁢ k k ! ⁢ ( y - y 0 ) k , e, então, a solução completa do problema de Cauchy é: (68) u ⁢ ( x ; y ) = ∑ h , k u h ⁢ k h ! ⁢ k ! ⁢ x h ⁢ ( y - y 0 ) k , com todos os coeficientes uhk determinados pelos dados de Cauchy. Como os coeficientes são únicos, podemos estabelecer: O problema de Cauchy não admite mais de uma solução holomórfica, representada pela série da equação (68). Essa é a unicidade da solução. Sua existência depende do fato da série da equação (68) ser convergente para |x| e |y − y0| limitados por certos valores apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial de segunda ordem possui problema de Cauchy bem definido se especificarmos a função e sua primeira derivada em relação a uma de suas variáveis numa superfície em que dita variável adota um valor fixo, e que, ademais, se a solução existe, então ela é única. Problema de Cauchy-Kovalevskaya para a equação de Klein-Gordon-Fock. Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [equação (56)]. Como estamos interessados na evolução temporal da solução, escolheremos a variável t para enunciar o problema de Cauchy –notando que essa escolha determina já o uso da dinâmica instantânea–: Seja u(x) = u(t; x) uma função que satisfaz à equação de segunda ordem: (69) ∂ 2 ⁡ u ∂ ⁡ t 2 ⁢ ( x ) = ( ∇ 2 - m 2 ) ⁢ u ⁢ ( x ) , sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0: (70) u ⁢ ( 0 ; x ) = u 0 ⁢ ( x ) e ∂ t ⁡ u ⁢ ( 0 ; x ) = u 1 ⁢ ( x ) . Logo, vemos que a equação (69) tem a forma da equação (61) e, portanto, a tese do teorema de Cauchy-Kovalevskaya é aplicável. Para solucionar tal equação passamos ao espaço dos momentos por meio da transformação de Fourier aplicada à função u. Substituíndo-a na equação (69) vemos que ela tem de ter a forma: (71) u ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p | 2 ⁢ p 0 | ⁢ [ δ ⁢ ( p 0 - ω p ) + δ ⁢ ( p 0 + ω p ) ] (72) × u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x , com: ωp≡p2+m2 –pode-se reconhecer aqui a forma do gerador P0 da equação (32)–. Integrando na variável p0 com o uso das distribuições delta de Dirac, obtemos a separação em partes de freqüência positiva e freqüência negativa: (73) u ( x ) = ( 2 π ) - 2 ∫ d 3 ⁢ p 2 ⁢ ω p [ u + ( p ) e - i ⁢ p ⁢ x | p 0 = ω p + u - ( p ) e - i ⁢ p ⁢ x | p 0 = - ω p ] . Coloquemos aqui os dados de Cauchy da equação (70). Primeiramente, como u0(x) = u(0; x): (74) u 0 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ [ u + ⁢ ( p ) + u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x . Mas podemos escrever: (75) u 0 ⁢ ( x ) = ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ δ ⁢ ( x - y ) = ( 2 ⁢ π ) - 3 ⁢ ∫ d 3 ⁢ p ⁢ ( ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y ) ⁢ e i ⁢ p ⋅ x , a partir do qual obtemos, via uma comparação das equações (74) e (75) e a independência linear das funções exponenciais eip⋅ x, que: (76) u + ⁢ ( p ) + u - ⁢ ( p ) = 2 ⁢ ω p ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . Usaremos agora os dados de Cauchy referidos à derivada de u. Como u1(x) = ∂tu(0; x): (77) u 1 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ ( - i ⁢ ω p ) ⁢ [ u + ⁢ ( p ) - u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x , e, novamente reescrevendo o lado esquerdo com ajuda da distribuição delta de Dirac tridimensional e comparando com a equação (77), encontramos que: (78) u + ⁢ ( p ) - u - ⁢ ( p ) = 2 ⁢ i ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 1 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . As equações (76) e (78) nos permitem encontrar explicitamente as funções u±(p) em dependência com os dados de Cauchy u0 e u1: (79) u ± ⁢ ( p ) = ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ [ ω p ⁢ u 0 ⁢ ( y ) ± i ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⋅ y . Substituíndo-as na equação (73) e completando p⋅ y = py|y0 = 0, o que serve para escrever a integração com medida d3y explícitamente na superfície y0 = 0 em que são fornecidos os dados de Cauchy: (80) u ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ ∫ y 0 = 0 d 3 ⁢ y × [ ω p ⁢ u 0 ⁢ ( y ) + i ⁢ sgn ⁢ ( p 0 ) ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⁢ ( x - y ) . É possível escrever: (81) ω p ⁢ e - i ⁢ p ⁢ ( x - y ) = i ⁢ sgn ⁢ ( p 0 ) ⁢ ∂ 0 x ⁡ e - i ⁢ p ⁢ ( x - y ) , e assim: (82) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 x ⁡ D ⁢ ( x - y ) + D ⁢ ( x - y ) ⁢ u 1 ⁢ ( y ) ] , com a definição da «distribuição de Jordan-Pauli»: (83) D ⁢ ( x ) := i ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ sgn ⁢ ( p 0 ) ⁢ e - i ⁢ p ⁢ x . Esta distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac que aparece em seu integrando, ela satisfaz a equação de Klein-Gordon-Fock com massa m, isto é, a mesma equação diferencial do campo u: (84) ( □ + m 2 ) ⁢ D ⁢ ( x ) = 0 . Também, de sua forma explícita dada na equação (83): (85) D ⁢ ( x ) = - D ⁢ ( - x ) . Fazendo uso, precisamente, desta última propriedade, podemos escrever a equação (82) com a derivada que age sobre D(x − y) não sendo já na variável x0, mas na variável y0: (86) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 y ⁡ D ⁢ ( y - x ) - D ⁢ ( y - x ) ⁢ u 1 ⁢ ( y ) ] . Essa mudança é útil porque, lembremos: u1⁢(y)=∂0y⁡u⁢(0;y); mas o fato de ser y0 = 0 já está indicado na integral e, então, podemos escrever simplesmente, dentro dela, u1⁢(y)=∂0y⁡u⁢(y) e u0(y) = u(y). Assim: (87) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ u ⁢ ( y ) ⁢ ∂ ↔ 0 y ⁢ D ⁢ ( y - x ) . Aqui, o símbolo f⁢∂↔⁢g significa f∂ g − ∂ fg. Usando mais uma vez a equação (85), a equação (87) é igual a: (88) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície y0 = 0, que, existindo, é única, como demonstrado na construção anterior. A causalidade da qual falávamos se evidencia na expressão –os detalhes do cálculo são mostrados, por exemplo, na Ref. [53]–: (89) D ⁢ ( x ) = 1 2 ⁢ π ⁢ sgn ⁢ ( x 0 ) ⁢ [ δ ⁢ ( x ) - Θ ⁢ ( x 2 ) ⁢ m 2 ⁢ x 2 ⁢ J 1 ⁢ ( m ⁢ x 2 ) ] , o que implica que: (90) supp ⁢ ( D ⁢ ( x ) ) = V + ⁢ ( 0 ) ∪ V - ⁢ ( 0 ) , com: (91) V + ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≥ x 0 } o «cone de luz futuro em relação ao ponto x», e (92) V - ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≤ x 0 } o «cone de luz passado em relação ao ponto x». Para terminar de introduzir a nomenclatura, digamos que a união V+(x)∪ V−(x) é o «cone de luz com vértice no ponto x». Isto é, D(x) tem suporte causal em relação à origem do sistema de coordenadas. Vejamos o que isto quer dizer à luz da equação (87): Da equação (90) temos que, transladando a origem até o ponto x em que queremos conhecer o valor do campo u, D(y − x) tem suporte no cone de luz com vértice em x, isto é, u(x) não é afetado pelos valores que no passado o campo tomou fora do cone de luz de x, nem afetará os valores que o campo tomará fora do cone de luz de x no futuro. 3.2. Problema de Goursat Consideremos agora que: nossa solução, embora satisfatória, não é tão geral como gostaríamos, pois precisa do conhecimento dos dados iniciais numa superfície de tempo constante, o que obriga a escolha da forma dinâmica instantânea. Mas, o que aconteceria se os dados fossem conhecidos numa superfície diferente? Voltemos ao problema de valores iniciais como enunciado na equação (57), e suponhamos que o espaço m-dimensional seja submetido à transformação de coordenadas: (93) X 1 = G 1 ⁢ ( x 1 ; ⋯ ; x m ) , ⋯ , X m = G m ⁢ ( x 1 ; ⋯ ; x m ) , de tal forma que Xm = Gm(x1;⋯; xm) = 0 seja a superfície em que são conhecidos os dados iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas, com u(x1;⋯; xm) = U(G1(x1;⋯; xm);⋯; Gm(x1;⋯; xm)): (94) Φ ⁢ ( U ; X i ; ∂ ⁡ U ∂ ⁡ X i ; ∂ 2 ⁡ U ∂ ⁡ X i 2 ; ∂ 2 ⁡ U ∂ ⁡ X i ⁢ ∂ ⁡ X k ) = 0 . Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações na teoria, pois parece que podemos simplesmente aplicar o teorema de Cauchy-Kovalevskaya à nova equação diferencial. Porém, suponhamos que a equação (59) seja linear, e que tem portanto a seguinte forma geral: (95) ∑ i , k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + C ⁢ u = f , com Aik = Aki, Bi, C e f funções das variáveis xi. Suponhamos agora que as transformações da equação (93) sejam feitas. Então usando a regra da cadeia obtemos que a equação (95) é, em relação às variáveis Xi: (96) ∑ j , l ( ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G j ∂ ⁡ x i ⁢ ∂ ⁡ G l ∂ ⁡ x k ) ⁢ ∂ 2 ⁡ U ∂ ⁡ X j ⁢ ∂ ⁡ X l + ∑ l ( ∑ i B i ⁢ ∂ ⁡ G l ∂ ⁡ x i ) ⁢ ∂ ⁡ U ∂ ⁡ X l + C ⁢ U = f . Como temos observado, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumprimento da equação (60), isto é, ele será aplicável só se ∂2⁡U/∂⁡Xm2 aparece na equação (96). Isto coloca em primeiro plano a «forma característica» 𝔸 definida como5: (97) 𝔸 ⁢ ( γ 1 ; ⋯ ; γ m ) := ∑ i , k γ i ⁢ A i ⁢ k ⁢ γ k . Da equação (96) vemos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz se: (98) ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G m ∂ ⁡ x i ⁢ ∂ ⁡ G m ∂ ⁡ x k = 0 . Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode ser realizada trivialmente. As superfícies Gm(x1;⋯; xm) = 0 para as quais isto acontece recebem o nome de «superfícies características» da equação diferencial. O problema dos valores iniciais em que a superfície inicial é uma superfície característica é conhecido como «problema de Goursat» [54], e o desenvolveremos a seguir. Seja a seguinte equação diferencial em que a segunda derivada em relação à variável xm não pode ser isolada, pois não aparece; ou seja, a equação diferencial escrita em termos de coordenadas tais que a superfície xm = 0 é uma superfície característica (Amm = 0): (99) ∑ i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i = 1 m - 1 A i ⁢ i ⁢ ∂ 2 ⁡ u ∂ ⁡ x i 2 + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + c ⁢ u = f . Nosso primeiro propósito será ver se os dados iniciais que são suficientes no problema fora de superfícies características são também suficientes nesse caso. Suponhamos, pois, que sejam conhecidos: (100) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) ; ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . Façamos, como anteriormente, a expansão ao redor de xm = 0: (101) u = u 0 + u 1 ⁢ x m + ⋯ + u h h ! ⁢ x m h + ⋯ ; u h = u h ⁢ ( x 1 ; ⋯ ; x m ) ≡ ∂ h ⁡ u ∂ ⁡ x m h | x m = 0 . Colocando essa expansão na equação (99), então avaliando em xm = 0, obtemos já não uma expressão para u2 como outrora obtivemos, mas uma equação diferencial para u1: (102) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u 1 ∂ ⁡ x i + B m ⁢ u 1 + H 1 = 0 , com H1 dependendo somente de u0 e suas derivadas: (103) H 1 = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u 0 ∂ ⁡ x i + C ⁢ u 0 - f . Vemos, pois, que se u1 não for dado de forma a satisfazer essa equação diferencial, então o problema de valores iniciais com os dados iniciais da equação (100) não tem solução. Portanto, precisamos fornecer outros dados iniciais, a saber, os necessários para que as equações diferenciais que se obtêm para as funções uh possam ser univocamente solucionadas. A equação (102) é uma equação diferencial parcial de primeira ordem para u1. Vejamos se também as equações para os outros uh são desse tipo. Derivando a equação (99) h − 1 vezes em relação a xm e então tomando xm = 0, obtemos a equação diferencial para uh: (104) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u h ∂ ⁡ x i + B m ⁢ u h + H h = 0 , com: (105) H h = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u h - 1 ∂ ⁡ x i + C ⁢ u h - 1 - ∂ h - 1 ⁡ f ∂ ⁡ x m h - 1 . Observamos que todas as equações diferenciais que se obtêm para as funções uh são de primeira ordem. Para solucioná-las, estudemos o método das características para esse tipo de equações. Para simplificar a exposição, além disso, consideremos o caso de duas variáveis e suponhamos que queremos resolver a equação: (106) A ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ x + B ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ y - C ⁢ ( x ; y ; u ) = 0 . As equações (104) são todas desse tipo, com a particularidade de ser A(x; y) = 0, o que colocaremos no final. Solucionar a equação (106) significa determinar uma solução u = z(x; y); essa superfície solução tem vetor normal n = (∂ z/∂ x;∂ z/∂ y; − 1); portanto, definindo o campo vetorial F = (A; B; C), a equação (106) pode ser escrita como: (107) F ⋅ n = 0 . Ou seja, F é tangente à superfície solução u = z(x; y), tendo como consequência que esta é constituída por curvas integrais daquela; tais curvas integrais são chamadas «curvas características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os valores de u(x; y) numa curva γ no plano x − y, cujo uso permite estabelecer a curva Γ sobre a superfície z(x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser gerada uma curva integral de F, construindo assim a superfície z(x; y). Levando a ideia à prática, podemos parametrizar, para a em algum domínio de variação: (108) Γ ( a ) = ( x = x 0 ( a ) ; y = y 0 ( a ) ; z = z 0 ( a ) ) . Determinar para cada valor de a uma curva integral de F que passe por Γ(a) significa resolver, para cada valor de a, o «sistema de equações diferenciais de Lagrange-Charpit»: Para um parâmetro s: (109) d ⁢ x d ⁢ s = A ⁢ ( x ; y ) ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) , (110) d ⁢ y d ⁢ s = B ⁢ ( x ; y ) ; y ⁢ ( 0 ) = y 0 ⁢ ( a ) , (111) d ⁢ z d ⁢ s = C ⁢ ( x ; y ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) . As soluções desse sistema, (112) x = X ⁢ ( a ; s ) , y = Y ⁢ ( a ; s ) , z = Z ⁢ ( a ; s ) , são já uma representação paramétrica da superfície solução. Para obtê-la na forma u = z(x; y), precisaremos inverter: (113) a = Λ ⁢ ( x ; y ) e s = S ⁢ ( x ; y ) , com o qual a solução buscada será: (114) u ⁢ ( x ; y ) = Z ⁢ ( Λ ⁢ ( x ; y ) ; S ⁢ ( x ; y ) ) . Vale ressaltar que para que possa ser gerada a superfície solução a partir da curva Γ por ação do campo vetorial F, é preciso que Γ não seja já uma curva característica –uma curva integral de F–, pois então ela seria invariante pela ação de F. Vejamos como isto funciona em nosso caso: As equações (104) dão lugar às equações de Lagrange-Charpit com o lado direito da equação (109) nulo: (115) d ⁢ x d ⁢ s = 0 ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) . Isto é, x é independente do parâmetro s. Se os dados iniciais fossem dados numa linha de x = constante, então x seria também independente de a; logo não poderíamos obter a solução do sistema mais que para um valor constante de x. Concluimos: Os dados iniciais que são precisos para solucionar univocamente as equações (104) não podem ser dados na superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, se os dados iniciais estão na linha de y constante: (116) Γ = ( x = x 0 ( a ) ; y = y 0 ; z = z 0 ( a ) ) , com y0 independente de a. A equação (115) tem solução: x = x0(a). Substituíndo na equação (110), como x é independente de s, a integração se torna elementar: (117) s = ∫ y 0 y d ⁢ y B ⁢ ( x 0 ⁢ ( a ) ; y ) . Finalmente, a equação (111) será: (118) d ⁢ z d ⁢ s = C ⁢ ( x 0 ⁢ ( a ) ; y ⁢ ( a ; s ) ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) , que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução única. A análise recém realizada demonstra que as equações (104) que determinam as funções uh poderão ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por exemplo, com xk = constante, k ≠ m. Conclui-se que, quando o problema de valores iniciais está definido sobre uma superfície característica da equação diferencial, os dados iniciais não podem ser o valor da função e sua primeira derivada normal à superfície característica, pois em tal caso o problema pode não ter solução ou ter infinitas soluções. Em seu lugar, devem ser dados: o valor da função na superfície característica e o valor da função em uma superfície diferente dela. 3.3. Superfícies características da equação de Klein-Gordon-Fock Uma vez que temos visto que o problema de valores iniciais pode ser bem definido sobre superfícies características, apliquemos o conhecimento adquirido para a equação de Klein-Gordon-Fock com que iniciamos essa discusão [equação (56)]: (119) ∂ 2 ⁡ u ∂ ⁡ t 2 - ∂ 2 ⁡ u ∂ ⁡ x 2 - ∂ 2 ⁡ u ∂ ⁡ y 2 - ∂ 2 ⁡ u ∂ ⁡ z 2 + m 2 ⁢ u = 0 . Comparando com a equação (95), reconhecemos que para essa equação são6: (120) A μ ⁢ ν = η ~ μ ⁢ ν , B μ = 0 , C = m 2 e f = 0 . Aqui, η~μ⁢ν são as componentes do tensor métrico do espaço-tempo de Minkowski: (η~μ⁢ν)=diag⁢(+1;-1;-1;-1). A forma característica [vide a equação (97)] é aqui η~μ⁢ν⁢γμ⁢γν, que se anula para γμ um vetor tipo-luz: (121) ( γ 0 ) 2 = γ 2 . Assim sendo, a transformação de coordenadas Xμ = Gμ(t; x; y; z) será tal que X0 = constante é uma superfície característica se [vide a equação (98)] a função G0 satisfaz à equação diferencial: (122) ( ∂ ⁡ G 0 ∂ ⁡ t ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ x ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ y ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ z ) 2 = 0 , cuja solução é: (123) G 0 = a ⁢ t + b ⁢ x + c ⁢ y + d ⁢ z ; a = ± b 2 + c 2 + d 2 . Isto é, as superfícies características da equação de Klein-Gordon-Fock são as superfícies X0 = 0, com: (124) X 0 ∼ t ± b ⁢ x + c ⁢ y + d ⁢ z b 2 + c 2 + d 2 , ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade com a coordenada X0, podendo ser arbitráriamente escolhidas. Façamos uma escolha: Definição: Sejam (x0; x1; x2; x3) coordenadas cartesianas no espaço-tempo de Minkowski tais que o tensor métrico adota sua forma diagonal normalizada η~μ⁢ν. O conjunto de coordenadas (x+; x1; x2; x-), com: (125) x + := 1 2 ⁢ ( x 0 + x 3 ) , x - := 1 2 ⁢ ( x 0 - x 3 ) , é chamado conjunto de coordenadas do plano nulo. □ A eleição da superfície característica em que os dados iniciais sejam dados, quer x+ = 0, quer x− = 0, é um assunto puramente convencional, mas importante por ser, implícitamente, uma eleição do parâmetro de evolução dos campos, que doravante chamaremos «tempo». Escolhemos x+ como coordenada temporal; a seguinte nomenclatura é usada: x− é a coordenada «longitudinal», e x⊥ = (x1; x2) são as coordenadas «transversais». As coordenadas cartesianas (x0; x1; x2; x3) passarão a ser chamadas «coordenadas instantâneas», por razões óbvias. O fator de proporcionalidade escolhido na definição de x± na equação (125) tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é igual à unidade, de forma que o elemento de volume não muda: (126) d 4 ⁢ x = d ⁢ x + ⁢ d ⁢ x - ⁢ d 2 ⁢ x ⊥ . Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte representação matricial: (127) [ η a ⁢ b ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) = [ η a ⁢ b ] . Pelo proferido, concluímos que o problema de Goursat da equação de Klein-Gordon-Fock é o problema dos valores iniciais na dinâmica da frente de luz. E mais ainda: Essa é a única exceção à aplicabilidade do teorema de Cauchy-Kovalevskaya: É a única forma dinâmica na qual o problema dos valores iniciais não pode ser obtido por deformação da superfície inicial em alguma outra forma dinâmica. Passemos a estabelecer a solução do problema de Goursat da equação de Klein-Gordon-Fock. Para isso, lembremos da equação (88): Em coordenadas instantâneas: (128) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Denotemos a versão tetra-vetorial do integrando por Nμ(x; y): (129) N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) . Tomando a divergência em relação à variável y, vemos que: (130) ∂ μ y ⁡ N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ □ y ⁢ u ⁢ ( y ) - □ y ⁢ D ⁢ ( x - y ) ⁢ u ⁢ ( y ) = 0 , pois tanto u como D satisfazem à equação de Klein-Gordon-Fock de massa m [vide a equação (84)]. Portanto, sendo de divergência nula, podemos usar o teorema de Gauss no volume Ω limitado pelo sólido A − B − C − D na Fig. 4 –compare-se essa figura com a 3–, em que o ponto P, vértice do cone de luz, representa o ponto x em que desejamos conhecer o valor do campo u. Então teremos que: Figura 4 Volume de integração para a obtenção da solução do problema de Goursat da equação de Klein-Gordon-Fock. (131) 0 = ∫ Ω d 4 ⁢ y ⁢ ∂ μ y ⁡ N μ ⁢ ( x ; y ) = ∫ ∂ ⁡ Ω d σ μ ⁢ ( y ) ⁢ N μ ⁢ ( x ; y ) = ( ∫ A - B + ∫ B - C + ∫ C - D + ∫ D - A ) × D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) ⁢ d ⁢ σ μ ⁢ ( y ) . Porém, B − C está fora do cone de luz do ponto P, e a integral nessa superfície se anula, pois D(x − y) tem suporte causal. Assim sendo, identificando a integral sobre A − B como a solução da equação (128) e reconhecendo que os vetores normais às superfícies C − D e D − A são, respectivamente, nas coordenadas do plano nulo, (0;0;0; − 1) e (− 1; 0; 0; 0), obteremos que: (132) u ⁢ ( x ) = ∫ D - A D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - + ∫ C - D D ⁢ ( x - y ) ⁢ ∂ ↔ + y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y + , visto que a superfície D − A é de x+ = constante e a C − D é de x− = constante. Isto é concordante com nossos estudos prévios: A solução ao problema de valores iniciais é única e bem definida se os dados iniciais são o valor do campo na superfície característica e o valor dele em uma superfície diferente da anterior. Em outras palavras, temos substituído o valor de u e ∂0u em um plano tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular, podemos fazer o limite em que a superfície C − D se encontra em x− → − ∞, e os dados iniciais nessa superfície são substituídos pela «condição assintótica» [14, 15]: (133) lim x - → - ∞ ⁡ u ⁢ ( x ) = 0 . Em tal caso, a solução da equação (132) se simplifica a: (134) u ⁢ ( x ) = ∫ y + = y 0 + D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - , que precisa do conhecimento só do valor do campo na superfície isocrônica x+=x0+. . A densidade lagrangiana que deriva nessas equações é a seguinte:

(169) φ = μ φ * μ φ - m 2 φ * φ .

A substituição dela na equação (152) nos permite obter o tensor de energia-momento desse campo:

(170) Θ = ν μ φ ( μ φ ) ν φ + φ ( μ φ * ) ν φ * - δ φ ν μ = μ φ * ν φ + ν φ * μ φ - δ σ ν μ φ * σ φ + m 2 δ φ * ν μ φ .

O hamiltoniano invariante do plano nulo será portanto [equação (166)]:

(171) H P N ; φ = d 3 x ¯ [ φ * φ + m 2 φ * φ ] .

Consideremos agora a equação de Klein-Gordon-Fock [equação (168)] à que o campo escalar obedece. Nas coordenadas do plano nulo, o operador D’Alembertiano adota a forma:

(172) = 2 + - - ( ) 2 ; ( ) 2 = 1 2 + 2 2 .

A solução dela será facilmente encontrada ao tomarmos a transformada de Fourier do campo:

(173) φ ( x ) = ( 2 π ) - 3 / 2 d 4 p φ ^ ( p ) e - i p x = ( 2 π ) - 3 / 2 d p + d p - d 2 p φ ^ ( p ) × e - i ( p + x + + p - x - + p x ) ,

e daí que:

(174) ( + m 2 ) φ ( x ) = - ( 2 π ) - 3 / 2 d p + d p - d 2 p × ( 2 p + p - - ω p 2 ) φ ^ ( p ) e - i p x = 0 ;

aqui: ωp2:=m2+(p)2. Vemos que deverá ser satisfeita a relação: (2p+p--ωp2)φ^(p)=0, cuja solução distribucional é dada por [62]:

(175) φ ^ ( p ) = δ ( 2 p + p - - ω p 2 ) φ ( p ) = 1 | 2 p - | δ ( p + - ω p 2 2 p - ) φ ( p ) ,

com φ(p) uma função arbitrária. Substituindo na equação (173) e separando a região de integração da variável p+ no domínio positivo e no negativo:

(176) φ ( x ) = ( 2 π ) - 3 / 2 d 2 p - + d p - × { - 0 d p + | 2 p - | δ ( p + - ω p 2 2 p - ) φ ( p ) e - i p x + 0 + d p + | 2 p - | δ ( p + - ω p 2 2 p - ) φ ( p ) e - i p x } .

Façamos na primeira integral a substituição p → − p; usando então a propriedade de simetria da distribuição delta de Dirac, isto é, que δ(x) = δ(− x), obtemos que:

(177) φ ( x ) = ( 2 π ) - 3 / 2 d 2 p - + d p - 0 + d p + | 2 p - | × δ ( p + - ω p 2 2 p - ) [ φ ( - p ) e i p x + φ ( p ) e - i p x ] .

Como é indicado pelos limites de integração, aqui é p+ > 0. Mas o suporte da distribuição delta de Dirac exige que seja p+=ωp2/2p-, e como ωp2>0, é forçoso que seja p > 0. Assim é que devemos introduzir a função de Heaviside Θ(p) e então escrever:

(178) φ ( x ) = ( 2 π ) - 3 / 2 d 2 p d p - 0 + d p + | 2 p - | Θ ( p - ) × δ ( p + - ω p 2 | 2 p - | ) [ φ ( - p ) e i p x + φ ( p ) e - i p x ] .

Integrando finalmente a variável p+:

(179) φ ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × [ φ ( - p ) e i p x + φ ( p ) e - i p x ] | p + = E ,

em que temos escrito: d3p¯:=d2pdp-, e com a energia E definida segundo: E:=ωp2/|2p-|>0. Note que essa expressão é relativisticamente correta, pois a medida de integração é invariante sob transformações de Poincaré:

(180) d 2 p d p - | 2 p - | Θ ( p - ) = d 4 p | 2 p - | Θ ( p - ) δ ( p + - E ) = d 4 p Θ ( p - ) δ ( 2 p + p - - ω p 2 ) = d 4 p Θ ( p - ) δ ( p 2 - m 2 ) .

Lembremos, por outro lado, que Θ(p) é invariante sob transformações de Poincaré ortócronas, pois p é uma coordenada do tipo-luz.

É habitual realizar a normalização seguinte11 [53]:

(181) φ ( p ¯ ) := φ ( p ) | 2 p - | , φ ( - p ¯ ) := φ ( - p ) | 2 p - | ,

com a qual:

(182) φ ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × [ φ ( p ¯ ) e - i p x + φ ( - p ¯ ) e i p x ] | p + = E .

Finalmente, se o campo clássico é real, isto é, se φ(x) = φ(x), então sobre as amplitudes dos diferentes modos deve-se impor a condição:

(183) φ ( - p ) * = φ ( p ) , φ ( p ) * = φ ( - p ) .

Assim, a expansão em série de Fourier do campo escalar real é:

(184) φ ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × [ φ ( p ¯ ) e - i p x + φ ( p ¯ ) * e i p x ] | p + = E .

7. Campo de Dirac

Consideremos agora o campo fermiônico de Dirac (ψ,ψ¯). As equações de Dirac são12:

(185) ( i ∂̸ - m ) ψ ( x ) = 0 , ψ ¯ ( x ) ( i ∂̸ + m ) = 0 ,

as quais provêm da densidade lagrangiana:

(186) ψ = ψ ¯ ( i 2 ∂̸ - m ) ψ .

O tensor de energia-momento desse campo é obtido por substituição dessa densidade lagrangiana na equação (152):

(187) Θ = ν μ ψ ( μ ψ ) ν ψ + ν ψ ¯ φ ( μ ψ ¯ ) - δ ψ ν μ = i 2 ( ψ ¯ γ μ ν ψ - ν ψ ¯ γ μ ψ ) - δ ψ ¯ ν μ ( i 2 ∂̸ - m ) ψ .

O hamiltoniano invariante do plano nulo será portanto:

(188) H P N ; ψ = d 3 x ¯ [ - i 2 ψ ¯ ( γ - - + γ ) ψ + m ψ ¯ ψ ] .

7.1. Componentes dinâmicase não-dinâmicas

Investiguemos em detalhe a equação de Dirac [equação (185)]. Nas coordenadas do plano nulo, separando a derivada temporal ∂+:

(189) i γ + + ψ = ( m - i γ - - - i γ ) ψ .

A matriz γ+ não pode ser invertida,13 pois ela tem determinante nulo (isto pode ser visto, bem por cálculo direto, por exemplo, na representação quiral ou em qualquer outra, bem pelo fato de que seu quadrado é nulo devido à relação de anti-comutação a que as matrizes de Dirac satisfazem –o que indica que também a matriz γ é não invertível–). Portanto, poderemos isolar a derivada temporal de forma a escrever a equação (189) na forma da equação de Schrödinger somente pela definição dos projetores:

(190) Λ ± := 1 2 ( 1 ± γ 0 γ 3 ) = 1 2 γ 0 γ ± ,

os quais exibem as seguintes propriedades:

(191) Λ ± 2 = Λ ± ; Λ ± Λ = 0 ; Λ + + Λ - = 1 ,

como é possível provar por cálculo direto. Da mesma forma podem ser mostradas as igualdades que seguem:

(192) Λ ± γ 0 = γ 0 Λ , Λ + γ 0 γ - = 0 , Λ - γ 0 γ - = γ 0 γ - Λ - , Λ ± γ 0 γ = γ 0 γ Λ .

Finalmente, definimos as duas projeções do campo de Dirac segundo:

(193) ψ ± := Λ ± ψ ; ψ = ψ + + ψ - .

Com isto, multiplicando a equação (189) por γ0 pela esquerda e usando a definição de Λ+, obtemos:

(194) i 2 + ψ + = γ 0 ( m - i γ - - - i ) ψ .

Multiplicando pela esquerda por Λ+ e usando as propriedades mostradas na equação (192), chegamos a:

(195) i 2 + ψ + = γ 0 ( m - i γ ) ψ - .

Análogamente, multiplicando a equação (194) por Λ pela esquerda e usando a equação (192):

(196) i 2 - ψ - = γ 0 ( m - i γ ) ψ + .

A equação (195) é uma equação dinâmica para a componente ψ+; ela é portanto chamada «componente dinâmica» do campo de Dirac. A equação (196), por outro lado, não é uma equação dinâmica para ψ, visto que nenhuma derivada temporal aparece nela; ψ é chamada «componente não-dinâmica», e a equação (196) é uma equação de vínculo, a qual pode ser invertida da forma seguinte, explicitando o fato de que ψ é automaticamente conhecida uma vez que o é ψ+:

(197) ψ - = 1 i 2 - γ 0 ( m - i γ ) ψ + .

Este vínculo pode ser usado para eliminar ψ na equação (195). Encontramos que a equação de movimento da componente dinâmica do campo de Dirac não é senão a equação de Klein-Gordon-Fock:

(198) ( + m 2 ) ψ + = 0 .

7.2. Problema de Goursat

O problema de Goursat para o campo de Dirac pode ser abordado da mesma forma que na seção 3 3. Forma dinâmica do plano nulo e campos clássicos A discussão que acabamos de fazer a respeito da possibilidade de definir novas formas dinâmicas tem sido baseada na álgebra do grupo de Poincaré e exemplificada na mecânica do ponto material. E para tal, foi suficiente exigir a descrição unívoca de sua linha de mundo. No entanto, na teoria de campos isto não é suficiente, e devemos nos ocupar também da unicidade da descrição da evolução do campo, isto é, do problema de valores iniciais para as diferentes equações do campo. Com efeito: A estrutura causal da teoria da relatividade implica que o valor adotado pelo campo em cada ponto do espaço-tempo depende dos valores que ele tem adotado no cone de luz passado correspondente a tal ponto; donde a inicialização dos valores do campo em uma superfície isocrônica requer conhecer os valores do campo na interseção do referido cone de luz passado e a superfície inicial. Isto é mostrado para as três formas dinâmicas de Dirac na figura 3. Mas logo percebemos uma dificuldade na forma dinâmica do plano nulo: Enquanto que a interseção é uma região finita na forma instantânea e na forma-ponto, ela é uma região infinita na forma do plano nulo. Sendo assim, o problema dos valores iniciais no plano nulo não poderá ser abordado como uma simples transformação do problema de Cauchy, mas precisa ser estudado independentemente. Eis o objetivo da presente seção. Figura 3 Problema dos valores iniciais: (a) Na dinâmica instantânea, (b) na dinâmica forma-ponto, (c) na dinâmica da frente de luz. Na teoria relativística, a invariância sob translações implica que a equação que governa todas as componentes u(x) de todos os campos é a equação de Klein-Gordon-Fock: (56) ( □ + m 2 ) ⁢ u ⁢ ( x ) = 0 . Qualquer relação adicional entre as diferentes componentes de um mesmo campo constitui uma relação de vínculo, mas ela não impede o cumprimento da equação (56) –um caso especial, que pareceria contradizer o dito e que contudo não o faz, é o do campo eletromagnético, que estudaremos na seção 8–. Lembremos ao leitor que a obtenção dessa equação obedece ao fato de que os campos se transformam por representações do grupo de Poincaré, um de cujos operadores de Casimir é o quadrado do operador de momento: P2, então proporcional à identidade (com fator de proporcionalidade que temos denotado por m2), como o assegura o lema de Schur. Determinar quais dados são os que se precisa conhecer para poder antecipar o valor do campo em um ponto futuro é o problema dos valores iniciais, que para equações diferenciais de segunda ordem pode ser precisamente formulado da seguinte forma [51]: Problema dos valores iniciais: Seja (57) ϕ ( u ; x i ; ∂ ⁡ u ∂ ⁡ x i ; ∂ 2 ⁡ u ∂ ⁡ x i 2 ; ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k ) = 0 ( i = 1 , ⋯ , m ) uma equação diferencial parcial de segunda ordem, linear em u e suas derivadas com coeficientes que são funções quaisquer das variáveis xi. O problema dos valores iniciais com respeito à «superfície inicial» xm = 0 consiste em encontrar uma solução sujeita aos «dados iniciais»: (58) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) , ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . □ É claro, toda equação diferencial, quer ordinária, quer parcial, admite um número infinito de soluções, que são escritas como uma «integral geral» contendo um determinado número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em seu enunciado um conjunto de condições adicionais –os dados iniciais– que visam determinar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possível com elas determinar uma e só uma solução, pois pode acontecer que os dados iniciais sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os elementos arbitrários. Assim, diremos que o problema dos valores iniciais está bem definido se ele (i) tem solução, e (ii) dita solução é única. 3.1. Problema de Cauchy-Kovalevskaya O caso mais famoso do problema dos valores iniciais é o «problema de Cauchy», que se caracteriza porque na equação diferencial a segunda derivada de u em relação à variável xm que define a superfície inicial xm = 0 possui um coeficiente não nulo. As condições sob as quais o problema de Cauchy está bem definido são estabelecidas no seguinte teorema, que apresentaremos para o caso de duas variáveis independentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–: Teorema de Cauchy-Kovalevskaya: Seja o problema de valores iniciais para a equação diferencial parcial de segunda ordem e duas variáveis (59) ϕ ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ x 2 ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) = 0 . Se acontece que (60) ∂ ⁡ ϕ ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x 2 ) ≠ 0 , de tal forma que podemos escrever a equação (59) na forma: (61) ∂ 2 ⁡ u ∂ ⁡ x 2 = f ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) , com f uma função holomórfica –isto é, analítica e regular– na vizinhança de x = 0, então o problema de Cauchy está bem definido para qualquer valor funcional dos dados de Cauchy: (62) u ⁢ ( 0 ; y ) = u 0 ⁢ ( y ) e ∂ ⁡ u ∂ ⁡ x ⁢ ( 0 ; y ) = u 1 ⁢ ( y ) . □ O leitor interessado nos detalhes técnicos desse teorema pode consultar as Refs. [51, 52]. O que aqui exporemos é a construção da solução, que tem como consequência direta a sua unicidade. Escrevamos a função incógnita u(x; y) como série de potências na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy: (63) u = u 0 + u 1 ⁢ x + ⋯ + u h h ! ⁢ x h + ⋯ ; u h = u h ⁢ ( y ) ≡ ∂ h ⁡ u ∂ ⁡ x h | x = 0 . Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1, portanto, devemos nos preocupar em encontrar uh para h ≥ 2 em função deles. Notando que, em geral: (64) ∂ h + k ⁡ u ∂ ⁡ x h ⁢ ∂ ⁡ y k | x = 0 = ∂ k ⁡ u h ∂ ⁡ y k , podemos obter a solução desejada com o seguinte conjunto de passos: Tomando x = 0 na equação (61) obtemos: (65) u 2 = f ⁢ ( u 0 ; 0 ; y ; u 1 ; ∂ ⁡ u 0 ∂ ⁡ y ; ∂ 2 ⁡ u 0 ∂ ⁡ y 2 ; ∂ ⁡ u 1 ∂ ⁡ y ) , o que significa que u2 está determinado pelo conhecimento de u0 e u1. O fato de aparecer também suas derivadas na equação (65) não é motivo de preocupação, pois elas estão tomadas em relação à variável y com x = 0, e, portanto, podem se obter dos dados de Cauchy. Derivemos agora a equação (61) em relação a x, então coloquemos x = 0; obteremos: (66) u 3 = ⁢ ∂ ⁡ f ∂ ⁡ u ⁢ u 1 + ∂ ⁡ f ∂ ⁡ x + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ x ) ⁢ u 2 + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ y ) ⁢ ∂ ⁡ u 1 ∂ ⁡ y + ⋯ + ∂ ⁡ f ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x ⁢ ∂ ⁡ y ) ⁢ ∂ ⁡ u 2 ∂ ⁡ y , todas essas derivadas tomadas nos argumentos de f na equação (65). Assim, a equação (66) diz que a função u3 está determinada pelos dados de Cauchy e a função u2 obtida com eles. Note também que a condição de f ser holomórfica na vizinhança de x = 0 tem sido usada para tomar sua derivada nesse ponto. Isto ocorre também nos seguintes termos na seqüência da equação (63), que são obtidos por derivação sucessiva da equação (61) em x = 0: o resultado será sempre que a função uh é um polinômio de u0, u1, …, uh − 1 e suas derivadas, assim como de f e suas derivadas tomadas nos argumentos da equação (65). Uma vez que conhecemos as funções uh, podemos expressá-las como séries de potências na variável y ao redor do valor y0 fixo: (67) u h ⁢ ( y ) = ∑ k u h ⁢ k k ! ⁢ ( y - y 0 ) k , e, então, a solução completa do problema de Cauchy é: (68) u ⁢ ( x ; y ) = ∑ h , k u h ⁢ k h ! ⁢ k ! ⁢ x h ⁢ ( y - y 0 ) k , com todos os coeficientes uhk determinados pelos dados de Cauchy. Como os coeficientes são únicos, podemos estabelecer: O problema de Cauchy não admite mais de uma solução holomórfica, representada pela série da equação (68). Essa é a unicidade da solução. Sua existência depende do fato da série da equação (68) ser convergente para |x| e |y − y0| limitados por certos valores apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial de segunda ordem possui problema de Cauchy bem definido se especificarmos a função e sua primeira derivada em relação a uma de suas variáveis numa superfície em que dita variável adota um valor fixo, e que, ademais, se a solução existe, então ela é única. Problema de Cauchy-Kovalevskaya para a equação de Klein-Gordon-Fock. Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [equação (56)]. Como estamos interessados na evolução temporal da solução, escolheremos a variável t para enunciar o problema de Cauchy –notando que essa escolha determina já o uso da dinâmica instantânea–: Seja u(x) = u(t; x) uma função que satisfaz à equação de segunda ordem: (69) ∂ 2 ⁡ u ∂ ⁡ t 2 ⁢ ( x ) = ( ∇ 2 - m 2 ) ⁢ u ⁢ ( x ) , sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0: (70) u ⁢ ( 0 ; x ) = u 0 ⁢ ( x ) e ∂ t ⁡ u ⁢ ( 0 ; x ) = u 1 ⁢ ( x ) . Logo, vemos que a equação (69) tem a forma da equação (61) e, portanto, a tese do teorema de Cauchy-Kovalevskaya é aplicável. Para solucionar tal equação passamos ao espaço dos momentos por meio da transformação de Fourier aplicada à função u. Substituíndo-a na equação (69) vemos que ela tem de ter a forma: (71) u ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p | 2 ⁢ p 0 | ⁢ [ δ ⁢ ( p 0 - ω p ) + δ ⁢ ( p 0 + ω p ) ] (72) × u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x , com: ωp≡p2+m2 –pode-se reconhecer aqui a forma do gerador P0 da equação (32)–. Integrando na variável p0 com o uso das distribuições delta de Dirac, obtemos a separação em partes de freqüência positiva e freqüência negativa: (73) u ( x ) = ( 2 π ) - 2 ∫ d 3 ⁢ p 2 ⁢ ω p [ u + ( p ) e - i ⁢ p ⁢ x | p 0 = ω p + u - ( p ) e - i ⁢ p ⁢ x | p 0 = - ω p ] . Coloquemos aqui os dados de Cauchy da equação (70). Primeiramente, como u0(x) = u(0; x): (74) u 0 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ [ u + ⁢ ( p ) + u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x . Mas podemos escrever: (75) u 0 ⁢ ( x ) = ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ δ ⁢ ( x - y ) = ( 2 ⁢ π ) - 3 ⁢ ∫ d 3 ⁢ p ⁢ ( ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y ) ⁢ e i ⁢ p ⋅ x , a partir do qual obtemos, via uma comparação das equações (74) e (75) e a independência linear das funções exponenciais eip⋅ x, que: (76) u + ⁢ ( p ) + u - ⁢ ( p ) = 2 ⁢ ω p ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . Usaremos agora os dados de Cauchy referidos à derivada de u. Como u1(x) = ∂tu(0; x): (77) u 1 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ ( - i ⁢ ω p ) ⁢ [ u + ⁢ ( p ) - u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x , e, novamente reescrevendo o lado esquerdo com ajuda da distribuição delta de Dirac tridimensional e comparando com a equação (77), encontramos que: (78) u + ⁢ ( p ) - u - ⁢ ( p ) = 2 ⁢ i ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 1 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . As equações (76) e (78) nos permitem encontrar explicitamente as funções u±(p) em dependência com os dados de Cauchy u0 e u1: (79) u ± ⁢ ( p ) = ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ [ ω p ⁢ u 0 ⁢ ( y ) ± i ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⋅ y . Substituíndo-as na equação (73) e completando p⋅ y = py|y0 = 0, o que serve para escrever a integração com medida d3y explícitamente na superfície y0 = 0 em que são fornecidos os dados de Cauchy: (80) u ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ ∫ y 0 = 0 d 3 ⁢ y × [ ω p ⁢ u 0 ⁢ ( y ) + i ⁢ sgn ⁢ ( p 0 ) ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⁢ ( x - y ) . É possível escrever: (81) ω p ⁢ e - i ⁢ p ⁢ ( x - y ) = i ⁢ sgn ⁢ ( p 0 ) ⁢ ∂ 0 x ⁡ e - i ⁢ p ⁢ ( x - y ) , e assim: (82) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 x ⁡ D ⁢ ( x - y ) + D ⁢ ( x - y ) ⁢ u 1 ⁢ ( y ) ] , com a definição da «distribuição de Jordan-Pauli»: (83) D ⁢ ( x ) := i ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ sgn ⁢ ( p 0 ) ⁢ e - i ⁢ p ⁢ x . Esta distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac que aparece em seu integrando, ela satisfaz a equação de Klein-Gordon-Fock com massa m, isto é, a mesma equação diferencial do campo u: (84) ( □ + m 2 ) ⁢ D ⁢ ( x ) = 0 . Também, de sua forma explícita dada na equação (83): (85) D ⁢ ( x ) = - D ⁢ ( - x ) . Fazendo uso, precisamente, desta última propriedade, podemos escrever a equação (82) com a derivada que age sobre D(x − y) não sendo já na variável x0, mas na variável y0: (86) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 y ⁡ D ⁢ ( y - x ) - D ⁢ ( y - x ) ⁢ u 1 ⁢ ( y ) ] . Essa mudança é útil porque, lembremos: u1⁢(y)=∂0y⁡u⁢(0;y); mas o fato de ser y0 = 0 já está indicado na integral e, então, podemos escrever simplesmente, dentro dela, u1⁢(y)=∂0y⁡u⁢(y) e u0(y) = u(y). Assim: (87) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ u ⁢ ( y ) ⁢ ∂ ↔ 0 y ⁢ D ⁢ ( y - x ) . Aqui, o símbolo f⁢∂↔⁢g significa f∂ g − ∂ fg. Usando mais uma vez a equação (85), a equação (87) é igual a: (88) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície y0 = 0, que, existindo, é única, como demonstrado na construção anterior. A causalidade da qual falávamos se evidencia na expressão –os detalhes do cálculo são mostrados, por exemplo, na Ref. [53]–: (89) D ⁢ ( x ) = 1 2 ⁢ π ⁢ sgn ⁢ ( x 0 ) ⁢ [ δ ⁢ ( x ) - Θ ⁢ ( x 2 ) ⁢ m 2 ⁢ x 2 ⁢ J 1 ⁢ ( m ⁢ x 2 ) ] , o que implica que: (90) supp ⁢ ( D ⁢ ( x ) ) = V + ⁢ ( 0 ) ∪ V - ⁢ ( 0 ) , com: (91) V + ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≥ x 0 } o «cone de luz futuro em relação ao ponto x», e (92) V - ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≤ x 0 } o «cone de luz passado em relação ao ponto x». Para terminar de introduzir a nomenclatura, digamos que a união V+(x)∪ V−(x) é o «cone de luz com vértice no ponto x». Isto é, D(x) tem suporte causal em relação à origem do sistema de coordenadas. Vejamos o que isto quer dizer à luz da equação (87): Da equação (90) temos que, transladando a origem até o ponto x em que queremos conhecer o valor do campo u, D(y − x) tem suporte no cone de luz com vértice em x, isto é, u(x) não é afetado pelos valores que no passado o campo tomou fora do cone de luz de x, nem afetará os valores que o campo tomará fora do cone de luz de x no futuro. 3.2. Problema de Goursat Consideremos agora que: nossa solução, embora satisfatória, não é tão geral como gostaríamos, pois precisa do conhecimento dos dados iniciais numa superfície de tempo constante, o que obriga a escolha da forma dinâmica instantânea. Mas, o que aconteceria se os dados fossem conhecidos numa superfície diferente? Voltemos ao problema de valores iniciais como enunciado na equação (57), e suponhamos que o espaço m-dimensional seja submetido à transformação de coordenadas: (93) X 1 = G 1 ⁢ ( x 1 ; ⋯ ; x m ) , ⋯ , X m = G m ⁢ ( x 1 ; ⋯ ; x m ) , de tal forma que Xm = Gm(x1;⋯; xm) = 0 seja a superfície em que são conhecidos os dados iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas, com u(x1;⋯; xm) = U(G1(x1;⋯; xm);⋯; Gm(x1;⋯; xm)): (94) Φ ⁢ ( U ; X i ; ∂ ⁡ U ∂ ⁡ X i ; ∂ 2 ⁡ U ∂ ⁡ X i 2 ; ∂ 2 ⁡ U ∂ ⁡ X i ⁢ ∂ ⁡ X k ) = 0 . Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações na teoria, pois parece que podemos simplesmente aplicar o teorema de Cauchy-Kovalevskaya à nova equação diferencial. Porém, suponhamos que a equação (59) seja linear, e que tem portanto a seguinte forma geral: (95) ∑ i , k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + C ⁢ u = f , com Aik = Aki, Bi, C e f funções das variáveis xi. Suponhamos agora que as transformações da equação (93) sejam feitas. Então usando a regra da cadeia obtemos que a equação (95) é, em relação às variáveis Xi: (96) ∑ j , l ( ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G j ∂ ⁡ x i ⁢ ∂ ⁡ G l ∂ ⁡ x k ) ⁢ ∂ 2 ⁡ U ∂ ⁡ X j ⁢ ∂ ⁡ X l + ∑ l ( ∑ i B i ⁢ ∂ ⁡ G l ∂ ⁡ x i ) ⁢ ∂ ⁡ U ∂ ⁡ X l + C ⁢ U = f . Como temos observado, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumprimento da equação (60), isto é, ele será aplicável só se ∂2⁡U/∂⁡Xm2 aparece na equação (96). Isto coloca em primeiro plano a «forma característica» 𝔸 definida como5: (97) 𝔸 ⁢ ( γ 1 ; ⋯ ; γ m ) := ∑ i , k γ i ⁢ A i ⁢ k ⁢ γ k . Da equação (96) vemos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz se: (98) ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G m ∂ ⁡ x i ⁢ ∂ ⁡ G m ∂ ⁡ x k = 0 . Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode ser realizada trivialmente. As superfícies Gm(x1;⋯; xm) = 0 para as quais isto acontece recebem o nome de «superfícies características» da equação diferencial. O problema dos valores iniciais em que a superfície inicial é uma superfície característica é conhecido como «problema de Goursat» [54], e o desenvolveremos a seguir. Seja a seguinte equação diferencial em que a segunda derivada em relação à variável xm não pode ser isolada, pois não aparece; ou seja, a equação diferencial escrita em termos de coordenadas tais que a superfície xm = 0 é uma superfície característica (Amm = 0): (99) ∑ i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i = 1 m - 1 A i ⁢ i ⁢ ∂ 2 ⁡ u ∂ ⁡ x i 2 + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + c ⁢ u = f . Nosso primeiro propósito será ver se os dados iniciais que são suficientes no problema fora de superfícies características são também suficientes nesse caso. Suponhamos, pois, que sejam conhecidos: (100) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) ; ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . Façamos, como anteriormente, a expansão ao redor de xm = 0: (101) u = u 0 + u 1 ⁢ x m + ⋯ + u h h ! ⁢ x m h + ⋯ ; u h = u h ⁢ ( x 1 ; ⋯ ; x m ) ≡ ∂ h ⁡ u ∂ ⁡ x m h | x m = 0 . Colocando essa expansão na equação (99), então avaliando em xm = 0, obtemos já não uma expressão para u2 como outrora obtivemos, mas uma equação diferencial para u1: (102) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u 1 ∂ ⁡ x i + B m ⁢ u 1 + H 1 = 0 , com H1 dependendo somente de u0 e suas derivadas: (103) H 1 = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u 0 ∂ ⁡ x i + C ⁢ u 0 - f . Vemos, pois, que se u1 não for dado de forma a satisfazer essa equação diferencial, então o problema de valores iniciais com os dados iniciais da equação (100) não tem solução. Portanto, precisamos fornecer outros dados iniciais, a saber, os necessários para que as equações diferenciais que se obtêm para as funções uh possam ser univocamente solucionadas. A equação (102) é uma equação diferencial parcial de primeira ordem para u1. Vejamos se também as equações para os outros uh são desse tipo. Derivando a equação (99) h − 1 vezes em relação a xm e então tomando xm = 0, obtemos a equação diferencial para uh: (104) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u h ∂ ⁡ x i + B m ⁢ u h + H h = 0 , com: (105) H h = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u h - 1 ∂ ⁡ x i + C ⁢ u h - 1 - ∂ h - 1 ⁡ f ∂ ⁡ x m h - 1 . Observamos que todas as equações diferenciais que se obtêm para as funções uh são de primeira ordem. Para solucioná-las, estudemos o método das características para esse tipo de equações. Para simplificar a exposição, além disso, consideremos o caso de duas variáveis e suponhamos que queremos resolver a equação: (106) A ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ x + B ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ y - C ⁢ ( x ; y ; u ) = 0 . As equações (104) são todas desse tipo, com a particularidade de ser A(x; y) = 0, o que colocaremos no final. Solucionar a equação (106) significa determinar uma solução u = z(x; y); essa superfície solução tem vetor normal n = (∂ z/∂ x;∂ z/∂ y; − 1); portanto, definindo o campo vetorial F = (A; B; C), a equação (106) pode ser escrita como: (107) F ⋅ n = 0 . Ou seja, F é tangente à superfície solução u = z(x; y), tendo como consequência que esta é constituída por curvas integrais daquela; tais curvas integrais são chamadas «curvas características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os valores de u(x; y) numa curva γ no plano x − y, cujo uso permite estabelecer a curva Γ sobre a superfície z(x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser gerada uma curva integral de F, construindo assim a superfície z(x; y). Levando a ideia à prática, podemos parametrizar, para a em algum domínio de variação: (108) Γ ( a ) = ( x = x 0 ( a ) ; y = y 0 ( a ) ; z = z 0 ( a ) ) . Determinar para cada valor de a uma curva integral de F que passe por Γ(a) significa resolver, para cada valor de a, o «sistema de equações diferenciais de Lagrange-Charpit»: Para um parâmetro s: (109) d ⁢ x d ⁢ s = A ⁢ ( x ; y ) ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) , (110) d ⁢ y d ⁢ s = B ⁢ ( x ; y ) ; y ⁢ ( 0 ) = y 0 ⁢ ( a ) , (111) d ⁢ z d ⁢ s = C ⁢ ( x ; y ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) . As soluções desse sistema, (112) x = X ⁢ ( a ; s ) , y = Y ⁢ ( a ; s ) , z = Z ⁢ ( a ; s ) , são já uma representação paramétrica da superfície solução. Para obtê-la na forma u = z(x; y), precisaremos inverter: (113) a = Λ ⁢ ( x ; y ) e s = S ⁢ ( x ; y ) , com o qual a solução buscada será: (114) u ⁢ ( x ; y ) = Z ⁢ ( Λ ⁢ ( x ; y ) ; S ⁢ ( x ; y ) ) . Vale ressaltar que para que possa ser gerada a superfície solução a partir da curva Γ por ação do campo vetorial F, é preciso que Γ não seja já uma curva característica –uma curva integral de F–, pois então ela seria invariante pela ação de F. Vejamos como isto funciona em nosso caso: As equações (104) dão lugar às equações de Lagrange-Charpit com o lado direito da equação (109) nulo: (115) d ⁢ x d ⁢ s = 0 ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) . Isto é, x é independente do parâmetro s. Se os dados iniciais fossem dados numa linha de x = constante, então x seria também independente de a; logo não poderíamos obter a solução do sistema mais que para um valor constante de x. Concluimos: Os dados iniciais que são precisos para solucionar univocamente as equações (104) não podem ser dados na superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, se os dados iniciais estão na linha de y constante: (116) Γ = ( x = x 0 ( a ) ; y = y 0 ; z = z 0 ( a ) ) , com y0 independente de a. A equação (115) tem solução: x = x0(a). Substituíndo na equação (110), como x é independente de s, a integração se torna elementar: (117) s = ∫ y 0 y d ⁢ y B ⁢ ( x 0 ⁢ ( a ) ; y ) . Finalmente, a equação (111) será: (118) d ⁢ z d ⁢ s = C ⁢ ( x 0 ⁢ ( a ) ; y ⁢ ( a ; s ) ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) , que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução única. A análise recém realizada demonstra que as equações (104) que determinam as funções uh poderão ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por exemplo, com xk = constante, k ≠ m. Conclui-se que, quando o problema de valores iniciais está definido sobre uma superfície característica da equação diferencial, os dados iniciais não podem ser o valor da função e sua primeira derivada normal à superfície característica, pois em tal caso o problema pode não ter solução ou ter infinitas soluções. Em seu lugar, devem ser dados: o valor da função na superfície característica e o valor da função em uma superfície diferente dela. 3.3. Superfícies características da equação de Klein-Gordon-Fock Uma vez que temos visto que o problema de valores iniciais pode ser bem definido sobre superfícies características, apliquemos o conhecimento adquirido para a equação de Klein-Gordon-Fock com que iniciamos essa discusão [equação (56)]: (119) ∂ 2 ⁡ u ∂ ⁡ t 2 - ∂ 2 ⁡ u ∂ ⁡ x 2 - ∂ 2 ⁡ u ∂ ⁡ y 2 - ∂ 2 ⁡ u ∂ ⁡ z 2 + m 2 ⁢ u = 0 . Comparando com a equação (95), reconhecemos que para essa equação são6: (120) A μ ⁢ ν = η ~ μ ⁢ ν , B μ = 0 , C = m 2 e f = 0 . Aqui, η~μ⁢ν são as componentes do tensor métrico do espaço-tempo de Minkowski: (η~μ⁢ν)=diag⁢(+1;-1;-1;-1). A forma característica [vide a equação (97)] é aqui η~μ⁢ν⁢γμ⁢γν, que se anula para γμ um vetor tipo-luz: (121) ( γ 0 ) 2 = γ 2 . Assim sendo, a transformação de coordenadas Xμ = Gμ(t; x; y; z) será tal que X0 = constante é uma superfície característica se [vide a equação (98)] a função G0 satisfaz à equação diferencial: (122) ( ∂ ⁡ G 0 ∂ ⁡ t ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ x ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ y ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ z ) 2 = 0 , cuja solução é: (123) G 0 = a ⁢ t + b ⁢ x + c ⁢ y + d ⁢ z ; a = ± b 2 + c 2 + d 2 . Isto é, as superfícies características da equação de Klein-Gordon-Fock são as superfícies X0 = 0, com: (124) X 0 ∼ t ± b ⁢ x + c ⁢ y + d ⁢ z b 2 + c 2 + d 2 , ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade com a coordenada X0, podendo ser arbitráriamente escolhidas. Façamos uma escolha: Definição: Sejam (x0; x1; x2; x3) coordenadas cartesianas no espaço-tempo de Minkowski tais que o tensor métrico adota sua forma diagonal normalizada η~μ⁢ν. O conjunto de coordenadas (x+; x1; x2; x-), com: (125) x + := 1 2 ⁢ ( x 0 + x 3 ) , x - := 1 2 ⁢ ( x 0 - x 3 ) , é chamado conjunto de coordenadas do plano nulo. □ A eleição da superfície característica em que os dados iniciais sejam dados, quer x+ = 0, quer x− = 0, é um assunto puramente convencional, mas importante por ser, implícitamente, uma eleição do parâmetro de evolução dos campos, que doravante chamaremos «tempo». Escolhemos x+ como coordenada temporal; a seguinte nomenclatura é usada: x− é a coordenada «longitudinal», e x⊥ = (x1; x2) são as coordenadas «transversais». As coordenadas cartesianas (x0; x1; x2; x3) passarão a ser chamadas «coordenadas instantâneas», por razões óbvias. O fator de proporcionalidade escolhido na definição de x± na equação (125) tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é igual à unidade, de forma que o elemento de volume não muda: (126) d 4 ⁢ x = d ⁢ x + ⁢ d ⁢ x - ⁢ d 2 ⁢ x ⊥ . Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte representação matricial: (127) [ η a ⁢ b ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) = [ η a ⁢ b ] . Pelo proferido, concluímos que o problema de Goursat da equação de Klein-Gordon-Fock é o problema dos valores iniciais na dinâmica da frente de luz. E mais ainda: Essa é a única exceção à aplicabilidade do teorema de Cauchy-Kovalevskaya: É a única forma dinâmica na qual o problema dos valores iniciais não pode ser obtido por deformação da superfície inicial em alguma outra forma dinâmica. Passemos a estabelecer a solução do problema de Goursat da equação de Klein-Gordon-Fock. Para isso, lembremos da equação (88): Em coordenadas instantâneas: (128) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Denotemos a versão tetra-vetorial do integrando por Nμ(x; y): (129) N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) . Tomando a divergência em relação à variável y, vemos que: (130) ∂ μ y ⁡ N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ □ y ⁢ u ⁢ ( y ) - □ y ⁢ D ⁢ ( x - y ) ⁢ u ⁢ ( y ) = 0 , pois tanto u como D satisfazem à equação de Klein-Gordon-Fock de massa m [vide a equação (84)]. Portanto, sendo de divergência nula, podemos usar o teorema de Gauss no volume Ω limitado pelo sólido A − B − C − D na Fig. 4 –compare-se essa figura com a 3–, em que o ponto P, vértice do cone de luz, representa o ponto x em que desejamos conhecer o valor do campo u. Então teremos que: Figura 4 Volume de integração para a obtenção da solução do problema de Goursat da equação de Klein-Gordon-Fock. (131) 0 = ∫ Ω d 4 ⁢ y ⁢ ∂ μ y ⁡ N μ ⁢ ( x ; y ) = ∫ ∂ ⁡ Ω d σ μ ⁢ ( y ) ⁢ N μ ⁢ ( x ; y ) = ( ∫ A - B + ∫ B - C + ∫ C - D + ∫ D - A ) × D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) ⁢ d ⁢ σ μ ⁢ ( y ) . Porém, B − C está fora do cone de luz do ponto P, e a integral nessa superfície se anula, pois D(x − y) tem suporte causal. Assim sendo, identificando a integral sobre A − B como a solução da equação (128) e reconhecendo que os vetores normais às superfícies C − D e D − A são, respectivamente, nas coordenadas do plano nulo, (0;0;0; − 1) e (− 1; 0; 0; 0), obteremos que: (132) u ⁢ ( x ) = ∫ D - A D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - + ∫ C - D D ⁢ ( x - y ) ⁢ ∂ ↔ + y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y + , visto que a superfície D − A é de x+ = constante e a C − D é de x− = constante. Isto é concordante com nossos estudos prévios: A solução ao problema de valores iniciais é única e bem definida se os dados iniciais são o valor do campo na superfície característica e o valor dele em uma superfície diferente da anterior. Em outras palavras, temos substituído o valor de u e ∂0u em um plano tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular, podemos fazer o limite em que a superfície C − D se encontra em x− → − ∞, e os dados iniciais nessa superfície são substituídos pela «condição assintótica» [14, 15]: (133) lim x - → - ∞ ⁡ u ⁢ ( x ) = 0 . Em tal caso, a solução da equação (132) se simplifica a: (134) u ⁢ ( x ) = ∫ y + = y 0 + D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - , que precisa do conhecimento só do valor do campo na superfície isocrônica x+=x0+. : Solucionando primeiro o problema de Cauchy (na dinâmica instantânea) e passando depois à dinâmica do plano nulo por aplicação do teorema de Gauss num volume convenientemente escolhido. Como, no entanto, este caminho já foi percorrido anteriormente –e não encontraremos dificuldades em percorrê-lo para o caso presente se assim o desejarmos–, é mais instrutivo oferecer uma outra forma de obter a desejada solução. Tal o faremos explorando a divisão recém feita entre as componentes dinâmicas e as não-dinâmicas. Devido a que as componentes dinâmicas satisfazem a equação de Klein-Gordon-Fock [equação (198)], seu problema de Goursat tem a solução dada na equação (134), que por uma integração por partes pode ser escrita da seguinte forma:

(199) ψ + ( x ) = y + = y 0 + d 3 y ¯ 2 - x D ( x - y ) ψ + ( y ) .

As componentes não-dinâmicas são então determinadas pela substituição da equação (199) na (197), da qual obtemos:

(200) ψ - ( x ) = - i 2 × y + = y 0 + d 3 y ¯ γ 0 ( m - i γ x ) D ( x - y ) ψ + ( y ) .

E pelo uso das definições mostradas na equação (193):

(201) ψ ( x ) = y + = y 0 + d 3 y ¯ [ 2 - x - i 2 γ 0 ( m - i γ x ) ] D ( x - y ) Λ + ψ ( y ) .

Usando então as equações (190)–(192), assim como o fato, já mencionado, de ser (γ+)2 = 0, vemos que é possível escrever a equação (201) na forma sucinta:

(202) ψ ( x ) = - i y + = y 0 + d 3 y ¯ S ( x - y ) γ + ψ ( y ) ,

com a distribuição S(x) definida como:

(203) S ( x ) := ( i ∂̸ + m ) D ( x ) .

Tendo encontrado a solução –o que, já o dissemos, imediatamente implica que ela é única– podemos afirmar que o problema de Goursat para o campo de Dirac está bem definido. Por outro lado, no problema de Cauchy seria necessário conhecer o campo ψ(0; x), que faz um total de quatro funções, pois as derivadas dele não serão necessárias devido a que a equação de Dirac é uma equação de primeira ordem; o mesmo número de dados é necessário na solução que apresentamos e na qual usamos a equação (199), que implica o conhecimento de ψ+ em x+ = 0 e x-=x0-, fazendo igualmente um total de quatro funções –sendo que essa última tem sido substituída por uma condição assintótica, o que não muda o número de dados iniciais–.

7.3. Espinores de polarização

Como cada uma das componentes do campo de Dirac, ψa(x), satisfaz a equação de Klein-Gordon-Fock,

(204) ( + m 2 ) ψ a ( x ) = 0 ,

cada uma delas irá ter uma expressão semelhante àquela da equação (182):

(205) ψ a ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × [ ψ a ( p ¯ ) e - i p x + ψ a ( - p ¯ ) e i p x ] | p + = E .

As amplitudes espinoriais ψ(p¯) que aqui aparecem devem ser tais que ψa(x) satisfaça a equação de Dirac [equação (185)]: Elas carregam a informação «adicional» não contida na equação de Klein-Gordon-Fock, isto é, a informação dos vínculos da teoria. Logo tais amplitudes definem os possíveis estados de polarização do campo de Dirac. Substituindo a equação (205) na (185):

(206) 0 = ( i ∂̸ - m ) ψ ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × [ ( - m ) ψ ( p ¯ ) e - i p x - ( + m ) ψ ( - p ¯ ) e i p x ] | p + = E .

Daqui concluímos que, uma vez que as soluções de freqüências positivas e as de freqüências negativas são linearmente independentes, deverão ser verificadas as equações:

(207) ( - m ) ψ ( p ¯ ) = 0 ; ( + m ) ψ ( - p ¯ ) = 0 .

Apresentaremos a seguir a solução para essas equações, inspirados na Ref. [23].

Comecemos com:

(208) ( - m ) u ( p ¯ ) = 0 .

De forma semelhante a que foram obtidas as equações (195) e (196), encontramos que:

(209) 2 p + u + = γ 0 ( m - γ p ) u - ,
(210) 2 p - u - = γ 0 ( m - γ p ) u + ,

lembrando que é p+ = E [vide a equação (206)]. A estratégia para solucionar essas equações será escrever uma base para uma das projeções do espinor e usar, então, a (209) ou a (210) para encontrar a outra. No apêndice B B. Matrizes de Dirac no plano nulo Na representação de Weyl as matrizes de Dirac são: (296) γ 0 = ( 0 2 1 2 1 2 0 2 ) , γ k = ( 0 2 - σ k σ k 0 2 ) , com σk as matrizes de Pauli: (297) σ 1 = ( 0 1 1 0 ) , σ 2 = ( 0 - i i 0 ) , σ 3 = ( 1 0 0 - 1 ) . Assim, temos que as matrizes γ±, definidas segundo: (298) γ ± := 1 2 ⁢ ( γ 0 ± γ 3 ) , têm a seguinte forma explícita, na representação em uso: (299) γ + = ( 0 0 0 0 0 0 0 2 2 0 0 0 0 0 0 0 ) , γ - = ( 0 0 2 0 0 0 0 0 0 0 0 0 0 2 0 0 ) . Os projetores Λ± definidos na equação (190) são portanto: (300) Λ + = ( 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 ) , Λ - = ( 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 ) . mostra-se a forma explícita dos projetores [equação (300)], da qual observamos que uma base para u será:

(211) u - ( 1 ) = ( 0 1 0 0 ) , u - ( - 1 ) = ( 0 0 1 0 ) .

Os espinores u+ correspondentes são obtidos usando a equação (209):

(212) u + ( 1 ) = 1 2 E ( - p 1 + i p 2 0 0 m ) ,
(213) u + ( - 1 ) = 1 2 E ( m 0 0 p 1 + i p 2 ) .

Ora, a equação (193) implica que a solução completa é obtida somando as componentes u e u+, o que leva a obter:

(214) u 1 = a 0 2 E ( - p 1 + i p 2 2 E 0 m ) ,
(215) u - 1 = a 0 2 E ( m 0 2 E p 1 + i p 2 ) .

Nessas expressões, a0 é um fator de normalização, que escolheremos convenientemente como sendo14:

(216) a 0 = E 2 | p - | .

Com isto:

(217) u 1 = 1 2 E 2 | p - | ( - p 1 + i p 2 2 E 0 m ) ,
(218) u - 1 = 1 2 E 2 | p - | ( m 0 2 E p 1 + i p 2 ) .

Assim é que podemos diretamente calcular:

u 1 u 1 + u - 1 u - 1 = 1 2 E 2 | p - | × ( p 2 + m 2 - 2 E ( p 1 - i p 2 ) - 2 E ( p 1 + i p 2 ) 2 E 2 2 m E 0 0 2 m E 2 m E 0 0 2 m E 2 E 2 2 E ( p 1 - i p 2 ) 2 E ( p 1 + i p 2 ) p 2 + m 2 ) .

Multiplicando pela direita por γ0:

(219) u 1 u ¯ 1 + u - 1 u ¯ - 1 = 1 | 2 p - | × ( m 0 2 | p - | - ( p 1 - i p 2 ) 0 m - ( p 1 + i p 2 ) 2 E 2 E p 1 - i p 2 m 0 p 1 + i p 2 2 | p - | 0 m ) .

E portanto, lembrando da representação de Weyl das matrizes de Dirac [apêndice B B. Matrizes de Dirac no plano nulo Na representação de Weyl as matrizes de Dirac são: (296) γ 0 = ( 0 2 1 2 1 2 0 2 ) , γ k = ( 0 2 - σ k σ k 0 2 ) , com σk as matrizes de Pauli: (297) σ 1 = ( 0 1 1 0 ) , σ 2 = ( 0 - i i 0 ) , σ 3 = ( 1 0 0 - 1 ) . Assim, temos que as matrizes γ±, definidas segundo: (298) γ ± := 1 2 ⁢ ( γ 0 ± γ 3 ) , têm a seguinte forma explícita, na representação em uso: (299) γ + = ( 0 0 0 0 0 0 0 2 2 0 0 0 0 0 0 0 ) , γ - = ( 0 0 2 0 0 0 0 0 0 0 0 0 0 2 0 0 ) . Os projetores Λ± definidos na equação (190) são portanto: (300) Λ + = ( 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 ) , Λ - = ( 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 ) . ], reconhecemos que a equação anterior se iguala a:

(220) s = ± 1 u s u ¯ s = E γ + + | p - | γ - + p γ + m | 2 p - | .

Demos agora, por método análogo, solução à segunda das equações (207):

(221) ( + m ) v = 0 ,

da qual se segue, após projeção com Λ±, que as componentes do espinor v se relacionam por:

(222) v + = - γ 0 ( m + p γ ) 2 E v - .

Usando a mesma base apresentada na equação (211) para os espinores v e usando a relação da equação (222), obtemos:

(223) v + ( 1 ) = - 1 2 E ( p 1 - i p 2 0 0 m ) ,
(224) v + ( - 1 ) = - 1 2 E ( m 0 0 - p 1 - i p 2 ) .

A equação (193) implica por sua vez que a solução completa é:

(225) v 1 = 1 2 E 2 | p - | ( - p 1 + i p 2 2 E 0 - m ) ,
(226) v - 1 = 1 2 E 2 | p - | ( - m 0 2 E p 1 + i p 2 ) .

O cálculo direto mostra também que a seguinte regra de soma rege para os espinores de polarização vs:

(227) s = ± 1 v s v ¯ s = E γ + + | p - | γ - + p γ - m | 2 p - | .

8. Campo eletromagnético

As equações do campo eletromagnético são as equações de Maxwell, que no espaço vazio se leem [60, 61] (em unidades com c = 1, como temos determinado de início):

(228) E = 0 ; B = 0 ; × E + B t = 0 ; × B - E t = 0 .

Em função do «tensor de Faraday» Fμν, definido da forma seguinte:

(229) [ F μ ν ] := ( 0 E x E y E z - E x 0 - B z B y - E y B z 0 - B x - E z - B y B x 0 ) = - [ F ν μ ] ,

as equações de Maxwell no vácuo se escrevem:

(230) μ F μ ν = 0 , ρ F μ ν + μ F ν ρ + ν F ρ μ = 0 ,

essa última conhecida como «identidade de Bianchi». Essas equações permitem a introdução do «potencial eletromagnético», Aμ(x), segundo:

(231) F μ ν = : μ A ν - ν A μ .

A este campo chamaremos doravante «campo eletromagnético», ou às vezes –para explicitar que ele será considerado livre– «campo da radiação». Ao passo que a identidade de Bianchi se mantém idênticamente satisfeita, a equação do movimento do campo eletromagnético [primeira das equações (230)] se reescreve:

(232) A ν ( x ) - ν ( μ A μ ( x ) ) = 0 ,

que pode ser obtida da densidade lagrangiana:

(233) A = - 1 4 F μ ν F μ ν .

8.1. Componentes dinâmicas e não-dinâmicas. Condição de gauge do plano nulo

Poderia parecer, olhando para a equação (232), que o campo de radiação não está obrigado a satisfazer a equação de Klein-Gordon-Fock. No entanto, o termo adicional pode ser removido pela imposição de uma condição subsidiária (condição de gauge ou de calibre) cuja possibilidade se manifesta pela não unicidade da relação entre o potencial e os campos E e B: Estes não são modificados se o potencial é redefinido pela adição de um termo de divergência, AμAμ + ∂μ f.15 Para tal remoção bastará exigir que seja ∂ν⁡(∂μ Aμ) = 0, que é o mesmo que ∂μ Aμ = constante; impondo então que o campo se anule no infinito, a constante deve por força ser nula e, assim, a equação de Klein-Gordon-Fock é obedecida sob a «condição de gauge de Lorenz»16:

(234) μ A μ ( x ) = + A + + A + - A - = 0 .

Essa condição de gauge elimina um grau de liberdade da teoria, mas não elimina por completo a liberdade de gauge, pois ainda a equação de Klein-Gordon-Fock e a condição de gauge de Lorenz serão satisfeitas simultâneamente caso se opere uma transformação de gauge com uma função harmônica,17f = 0. Para eliminar por completo a liberdade de gauge deve ser imposta uma condição adicional; a simplificação máxima na dinâmica da frente de luz consiste em tornar a condição de gauge de Lorenz numa relação puramente cinemática, eliminando toda dependência temporal nela; para tal será suficiente exigir que seja ∂+A+ = 0, mas então a equação □ A+ = 0 será igual a 2A+=0, cuja solução, sob as condições assintóticas de desvanecimento no infinito, é a nula. A essa se chama a «condição de gauge do plano nulo»18:

(235) A + ( x ) = 0 .

Isto elimina toda a liberdade de gauge, mostrando que o campo eletromagnético possue dois graus de liberdade. Efetivamente, toda a informação está contida nas equações dinâmicas para as componentes transversais:

(236) A α ( x ) = 0 ,

e nas equações de vínculo que provêm das condições de gauge [equações (234) e (235)]:

(237) A + = 0 , A - = - 1 - α A α .

As componentes transversais Aα são chamadas «componentes dinâmicas» do campo de radiação, enquanto que A+ e A são as «não-dinâmicas», por estarem totalmente determinadas pelos vínculos.

É útil mencionar adicionalmente que, como afirmado nas Refs. [14, 15, 24], a análise que fizemos antes do problema de Goursat [vide a seção 3 3. Forma dinâmica do plano nulo e campos clássicos A discussão que acabamos de fazer a respeito da possibilidade de definir novas formas dinâmicas tem sido baseada na álgebra do grupo de Poincaré e exemplificada na mecânica do ponto material. E para tal, foi suficiente exigir a descrição unívoca de sua linha de mundo. No entanto, na teoria de campos isto não é suficiente, e devemos nos ocupar também da unicidade da descrição da evolução do campo, isto é, do problema de valores iniciais para as diferentes equações do campo. Com efeito: A estrutura causal da teoria da relatividade implica que o valor adotado pelo campo em cada ponto do espaço-tempo depende dos valores que ele tem adotado no cone de luz passado correspondente a tal ponto; donde a inicialização dos valores do campo em uma superfície isocrônica requer conhecer os valores do campo na interseção do referido cone de luz passado e a superfície inicial. Isto é mostrado para as três formas dinâmicas de Dirac na figura 3. Mas logo percebemos uma dificuldade na forma dinâmica do plano nulo: Enquanto que a interseção é uma região finita na forma instantânea e na forma-ponto, ela é uma região infinita na forma do plano nulo. Sendo assim, o problema dos valores iniciais no plano nulo não poderá ser abordado como uma simples transformação do problema de Cauchy, mas precisa ser estudado independentemente. Eis o objetivo da presente seção. Figura 3 Problema dos valores iniciais: (a) Na dinâmica instantânea, (b) na dinâmica forma-ponto, (c) na dinâmica da frente de luz. Na teoria relativística, a invariância sob translações implica que a equação que governa todas as componentes u(x) de todos os campos é a equação de Klein-Gordon-Fock: (56) ( □ + m 2 ) ⁢ u ⁢ ( x ) = 0 . Qualquer relação adicional entre as diferentes componentes de um mesmo campo constitui uma relação de vínculo, mas ela não impede o cumprimento da equação (56) –um caso especial, que pareceria contradizer o dito e que contudo não o faz, é o do campo eletromagnético, que estudaremos na seção 8–. Lembremos ao leitor que a obtenção dessa equação obedece ao fato de que os campos se transformam por representações do grupo de Poincaré, um de cujos operadores de Casimir é o quadrado do operador de momento: P2, então proporcional à identidade (com fator de proporcionalidade que temos denotado por m2), como o assegura o lema de Schur. Determinar quais dados são os que se precisa conhecer para poder antecipar o valor do campo em um ponto futuro é o problema dos valores iniciais, que para equações diferenciais de segunda ordem pode ser precisamente formulado da seguinte forma [51]: Problema dos valores iniciais: Seja (57) ϕ ( u ; x i ; ∂ ⁡ u ∂ ⁡ x i ; ∂ 2 ⁡ u ∂ ⁡ x i 2 ; ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k ) = 0 ( i = 1 , ⋯ , m ) uma equação diferencial parcial de segunda ordem, linear em u e suas derivadas com coeficientes que são funções quaisquer das variáveis xi. O problema dos valores iniciais com respeito à «superfície inicial» xm = 0 consiste em encontrar uma solução sujeita aos «dados iniciais»: (58) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) , ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . □ É claro, toda equação diferencial, quer ordinária, quer parcial, admite um número infinito de soluções, que são escritas como uma «integral geral» contendo um determinado número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em seu enunciado um conjunto de condições adicionais –os dados iniciais– que visam determinar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possível com elas determinar uma e só uma solução, pois pode acontecer que os dados iniciais sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os elementos arbitrários. Assim, diremos que o problema dos valores iniciais está bem definido se ele (i) tem solução, e (ii) dita solução é única. 3.1. Problema de Cauchy-Kovalevskaya O caso mais famoso do problema dos valores iniciais é o «problema de Cauchy», que se caracteriza porque na equação diferencial a segunda derivada de u em relação à variável xm que define a superfície inicial xm = 0 possui um coeficiente não nulo. As condições sob as quais o problema de Cauchy está bem definido são estabelecidas no seguinte teorema, que apresentaremos para o caso de duas variáveis independentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–: Teorema de Cauchy-Kovalevskaya: Seja o problema de valores iniciais para a equação diferencial parcial de segunda ordem e duas variáveis (59) ϕ ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ x 2 ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) = 0 . Se acontece que (60) ∂ ⁡ ϕ ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x 2 ) ≠ 0 , de tal forma que podemos escrever a equação (59) na forma: (61) ∂ 2 ⁡ u ∂ ⁡ x 2 = f ⁢ ( u ; x ; y ; ∂ ⁡ u ∂ ⁡ x ; ∂ ⁡ u ∂ ⁡ y ; ∂ 2 ⁡ u ∂ ⁡ y 2 ; ∂ 2 ⁡ u ∂ ⁡ x ⁢ ∂ ⁡ y ) , com f uma função holomórfica –isto é, analítica e regular– na vizinhança de x = 0, então o problema de Cauchy está bem definido para qualquer valor funcional dos dados de Cauchy: (62) u ⁢ ( 0 ; y ) = u 0 ⁢ ( y ) e ∂ ⁡ u ∂ ⁡ x ⁢ ( 0 ; y ) = u 1 ⁢ ( y ) . □ O leitor interessado nos detalhes técnicos desse teorema pode consultar as Refs. [51, 52]. O que aqui exporemos é a construção da solução, que tem como consequência direta a sua unicidade. Escrevamos a função incógnita u(x; y) como série de potências na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy: (63) u = u 0 + u 1 ⁢ x + ⋯ + u h h ! ⁢ x h + ⋯ ; u h = u h ⁢ ( y ) ≡ ∂ h ⁡ u ∂ ⁡ x h | x = 0 . Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1, portanto, devemos nos preocupar em encontrar uh para h ≥ 2 em função deles. Notando que, em geral: (64) ∂ h + k ⁡ u ∂ ⁡ x h ⁢ ∂ ⁡ y k | x = 0 = ∂ k ⁡ u h ∂ ⁡ y k , podemos obter a solução desejada com o seguinte conjunto de passos: Tomando x = 0 na equação (61) obtemos: (65) u 2 = f ⁢ ( u 0 ; 0 ; y ; u 1 ; ∂ ⁡ u 0 ∂ ⁡ y ; ∂ 2 ⁡ u 0 ∂ ⁡ y 2 ; ∂ ⁡ u 1 ∂ ⁡ y ) , o que significa que u2 está determinado pelo conhecimento de u0 e u1. O fato de aparecer também suas derivadas na equação (65) não é motivo de preocupação, pois elas estão tomadas em relação à variável y com x = 0, e, portanto, podem se obter dos dados de Cauchy. Derivemos agora a equação (61) em relação a x, então coloquemos x = 0; obteremos: (66) u 3 = ⁢ ∂ ⁡ f ∂ ⁡ u ⁢ u 1 + ∂ ⁡ f ∂ ⁡ x + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ x ) ⁢ u 2 + ∂ ⁡ f ∂ ⁡ ( ∂ ⁡ u / ∂ ⁡ y ) ⁢ ∂ ⁡ u 1 ∂ ⁡ y + ⋯ + ∂ ⁡ f ∂ ⁡ ( ∂ 2 ⁡ u / ∂ ⁡ x ⁢ ∂ ⁡ y ) ⁢ ∂ ⁡ u 2 ∂ ⁡ y , todas essas derivadas tomadas nos argumentos de f na equação (65). Assim, a equação (66) diz que a função u3 está determinada pelos dados de Cauchy e a função u2 obtida com eles. Note também que a condição de f ser holomórfica na vizinhança de x = 0 tem sido usada para tomar sua derivada nesse ponto. Isto ocorre também nos seguintes termos na seqüência da equação (63), que são obtidos por derivação sucessiva da equação (61) em x = 0: o resultado será sempre que a função uh é um polinômio de u0, u1, …, uh − 1 e suas derivadas, assim como de f e suas derivadas tomadas nos argumentos da equação (65). Uma vez que conhecemos as funções uh, podemos expressá-las como séries de potências na variável y ao redor do valor y0 fixo: (67) u h ⁢ ( y ) = ∑ k u h ⁢ k k ! ⁢ ( y - y 0 ) k , e, então, a solução completa do problema de Cauchy é: (68) u ⁢ ( x ; y ) = ∑ h , k u h ⁢ k h ! ⁢ k ! ⁢ x h ⁢ ( y - y 0 ) k , com todos os coeficientes uhk determinados pelos dados de Cauchy. Como os coeficientes são únicos, podemos estabelecer: O problema de Cauchy não admite mais de uma solução holomórfica, representada pela série da equação (68). Essa é a unicidade da solução. Sua existência depende do fato da série da equação (68) ser convergente para |x| e |y − y0| limitados por certos valores apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial de segunda ordem possui problema de Cauchy bem definido se especificarmos a função e sua primeira derivada em relação a uma de suas variáveis numa superfície em que dita variável adota um valor fixo, e que, ademais, se a solução existe, então ela é única. Problema de Cauchy-Kovalevskaya para a equação de Klein-Gordon-Fock. Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [equação (56)]. Como estamos interessados na evolução temporal da solução, escolheremos a variável t para enunciar o problema de Cauchy –notando que essa escolha determina já o uso da dinâmica instantânea–: Seja u(x) = u(t; x) uma função que satisfaz à equação de segunda ordem: (69) ∂ 2 ⁡ u ∂ ⁡ t 2 ⁢ ( x ) = ( ∇ 2 - m 2 ) ⁢ u ⁢ ( x ) , sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0: (70) u ⁢ ( 0 ; x ) = u 0 ⁢ ( x ) e ∂ t ⁡ u ⁢ ( 0 ; x ) = u 1 ⁢ ( x ) . Logo, vemos que a equação (69) tem a forma da equação (61) e, portanto, a tese do teorema de Cauchy-Kovalevskaya é aplicável. Para solucionar tal equação passamos ao espaço dos momentos por meio da transformação de Fourier aplicada à função u. Substituíndo-a na equação (69) vemos que ela tem de ter a forma: (71) u ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x = ( 2 ⁢ π ) - 2 ⁢ ∫ d 4 ⁢ p | 2 ⁢ p 0 | ⁢ [ δ ⁢ ( p 0 - ω p ) + δ ⁢ ( p 0 + ω p ) ] (72) × u ⁢ ( p ) ⁢ e - i ⁢ p ⁢ x , com: ωp≡p2+m2 –pode-se reconhecer aqui a forma do gerador P0 da equação (32)–. Integrando na variável p0 com o uso das distribuições delta de Dirac, obtemos a separação em partes de freqüência positiva e freqüência negativa: (73) u ( x ) = ( 2 π ) - 2 ∫ d 3 ⁢ p 2 ⁢ ω p [ u + ( p ) e - i ⁢ p ⁢ x | p 0 = ω p + u - ( p ) e - i ⁢ p ⁢ x | p 0 = - ω p ] . Coloquemos aqui os dados de Cauchy da equação (70). Primeiramente, como u0(x) = u(0; x): (74) u 0 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ [ u + ⁢ ( p ) + u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x . Mas podemos escrever: (75) u 0 ⁢ ( x ) = ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ δ ⁢ ( x - y ) = ( 2 ⁢ π ) - 3 ⁢ ∫ d 3 ⁢ p ⁢ ( ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y ) ⁢ e i ⁢ p ⋅ x , a partir do qual obtemos, via uma comparação das equações (74) e (75) e a independência linear das funções exponenciais eip⋅ x, que: (76) u + ⁢ ( p ) + u - ⁢ ( p ) = 2 ⁢ ω p ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 0 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . Usaremos agora os dados de Cauchy referidos à derivada de u. Como u1(x) = ∂tu(0; x): (77) u 1 ⁢ ( x ) = ( 2 ⁢ π ) - 2 ⁢ ∫ d 3 ⁢ p 2 ⁢ ω p ⁢ ( - i ⁢ ω p ) ⁢ [ u + ⁢ ( p ) - u - ⁢ ( p ) ] ⁢ e i ⁢ p ⋅ x , e, novamente reescrevendo o lado esquerdo com ajuda da distribuição delta de Dirac tridimensional e comparando com a equação (77), encontramos que: (78) u + ⁢ ( p ) - u - ⁢ ( p ) = 2 ⁢ i ⁢ ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ u 1 ⁢ ( y ) ⁢ e - i ⁢ p ⋅ y . As equações (76) e (78) nos permitem encontrar explicitamente as funções u±(p) em dependência com os dados de Cauchy u0 e u1: (79) u ± ⁢ ( p ) = ( 2 ⁢ π ) - 1 ⁢ ∫ d 3 ⁢ y ⁢ [ ω p ⁢ u 0 ⁢ ( y ) ± i ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⋅ y . Substituíndo-as na equação (73) e completando p⋅ y = py|y0 = 0, o que serve para escrever a integração com medida d3y explícitamente na superfície y0 = 0 em que são fornecidos os dados de Cauchy: (80) u ⁢ ( x ) = ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ ∫ y 0 = 0 d 3 ⁢ y × [ ω p ⁢ u 0 ⁢ ( y ) + i ⁢ sgn ⁢ ( p 0 ) ⁢ u 1 ⁢ ( y ) ] ⁢ e - i ⁢ p ⁢ ( x - y ) . É possível escrever: (81) ω p ⁢ e - i ⁢ p ⁢ ( x - y ) = i ⁢ sgn ⁢ ( p 0 ) ⁢ ∂ 0 x ⁡ e - i ⁢ p ⁢ ( x - y ) , e assim: (82) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 x ⁡ D ⁢ ( x - y ) + D ⁢ ( x - y ) ⁢ u 1 ⁢ ( y ) ] , com a definição da «distribuição de Jordan-Pauli»: (83) D ⁢ ( x ) := i ⁢ ( 2 ⁢ π ) - 3 ⁢ ∫ d 4 ⁢ p ⁢ δ ⁢ ( p 2 - m 2 ) ⁢ sgn ⁢ ( p 0 ) ⁢ e - i ⁢ p ⁢ x . Esta distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac que aparece em seu integrando, ela satisfaz a equação de Klein-Gordon-Fock com massa m, isto é, a mesma equação diferencial do campo u: (84) ( □ + m 2 ) ⁢ D ⁢ ( x ) = 0 . Também, de sua forma explícita dada na equação (83): (85) D ⁢ ( x ) = - D ⁢ ( - x ) . Fazendo uso, precisamente, desta última propriedade, podemos escrever a equação (82) com a derivada que age sobre D(x − y) não sendo já na variável x0, mas na variável y0: (86) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ [ u 0 ⁢ ( y ) ⁢ ∂ 0 y ⁡ D ⁢ ( y - x ) - D ⁢ ( y - x ) ⁢ u 1 ⁢ ( y ) ] . Essa mudança é útil porque, lembremos: u1⁢(y)=∂0y⁡u⁢(0;y); mas o fato de ser y0 = 0 já está indicado na integral e, então, podemos escrever simplesmente, dentro dela, u1⁢(y)=∂0y⁡u⁢(y) e u0(y) = u(y). Assim: (87) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ u ⁢ ( y ) ⁢ ∂ ↔ 0 y ⁢ D ⁢ ( y - x ) . Aqui, o símbolo f⁢∂↔⁢g significa f∂ g − ∂ fg. Usando mais uma vez a equação (85), a equação (87) é igual a: (88) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície y0 = 0, que, existindo, é única, como demonstrado na construção anterior. A causalidade da qual falávamos se evidencia na expressão –os detalhes do cálculo são mostrados, por exemplo, na Ref. [53]–: (89) D ⁢ ( x ) = 1 2 ⁢ π ⁢ sgn ⁢ ( x 0 ) ⁢ [ δ ⁢ ( x ) - Θ ⁢ ( x 2 ) ⁢ m 2 ⁢ x 2 ⁢ J 1 ⁢ ( m ⁢ x 2 ) ] , o que implica que: (90) supp ⁢ ( D ⁢ ( x ) ) = V + ⁢ ( 0 ) ∪ V - ⁢ ( 0 ) , com: (91) V + ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≥ x 0 } o «cone de luz futuro em relação ao ponto x», e (92) V - ⁢ ( x ) := { y ∈ 𝕄 | ( y - x ) 2 ≥ 0 ⁢ ∧ ⁢ y 0 ≤ x 0 } o «cone de luz passado em relação ao ponto x». Para terminar de introduzir a nomenclatura, digamos que a união V+(x)∪ V−(x) é o «cone de luz com vértice no ponto x». Isto é, D(x) tem suporte causal em relação à origem do sistema de coordenadas. Vejamos o que isto quer dizer à luz da equação (87): Da equação (90) temos que, transladando a origem até o ponto x em que queremos conhecer o valor do campo u, D(y − x) tem suporte no cone de luz com vértice em x, isto é, u(x) não é afetado pelos valores que no passado o campo tomou fora do cone de luz de x, nem afetará os valores que o campo tomará fora do cone de luz de x no futuro. 3.2. Problema de Goursat Consideremos agora que: nossa solução, embora satisfatória, não é tão geral como gostaríamos, pois precisa do conhecimento dos dados iniciais numa superfície de tempo constante, o que obriga a escolha da forma dinâmica instantânea. Mas, o que aconteceria se os dados fossem conhecidos numa superfície diferente? Voltemos ao problema de valores iniciais como enunciado na equação (57), e suponhamos que o espaço m-dimensional seja submetido à transformação de coordenadas: (93) X 1 = G 1 ⁢ ( x 1 ; ⋯ ; x m ) , ⋯ , X m = G m ⁢ ( x 1 ; ⋯ ; x m ) , de tal forma que Xm = Gm(x1;⋯; xm) = 0 seja a superfície em que são conhecidos os dados iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas, com u(x1;⋯; xm) = U(G1(x1;⋯; xm);⋯; Gm(x1;⋯; xm)): (94) Φ ⁢ ( U ; X i ; ∂ ⁡ U ∂ ⁡ X i ; ∂ 2 ⁡ U ∂ ⁡ X i 2 ; ∂ 2 ⁡ U ∂ ⁡ X i ⁢ ∂ ⁡ X k ) = 0 . Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações na teoria, pois parece que podemos simplesmente aplicar o teorema de Cauchy-Kovalevskaya à nova equação diferencial. Porém, suponhamos que a equação (59) seja linear, e que tem portanto a seguinte forma geral: (95) ∑ i , k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + C ⁢ u = f , com Aik = Aki, Bi, C e f funções das variáveis xi. Suponhamos agora que as transformações da equação (93) sejam feitas. Então usando a regra da cadeia obtemos que a equação (95) é, em relação às variáveis Xi: (96) ∑ j , l ( ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G j ∂ ⁡ x i ⁢ ∂ ⁡ G l ∂ ⁡ x k ) ⁢ ∂ 2 ⁡ U ∂ ⁡ X j ⁢ ∂ ⁡ X l + ∑ l ( ∑ i B i ⁢ ∂ ⁡ G l ∂ ⁡ x i ) ⁢ ∂ ⁡ U ∂ ⁡ X l + C ⁢ U = f . Como temos observado, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumprimento da equação (60), isto é, ele será aplicável só se ∂2⁡U/∂⁡Xm2 aparece na equação (96). Isto coloca em primeiro plano a «forma característica» 𝔸 definida como5: (97) 𝔸 ⁢ ( γ 1 ; ⋯ ; γ m ) := ∑ i , k γ i ⁢ A i ⁢ k ⁢ γ k . Da equação (96) vemos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz se: (98) ∑ i , k A i ⁢ k ⁢ ∂ ⁡ G m ∂ ⁡ x i ⁢ ∂ ⁡ G m ∂ ⁡ x k = 0 . Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode ser realizada trivialmente. As superfícies Gm(x1;⋯; xm) = 0 para as quais isto acontece recebem o nome de «superfícies características» da equação diferencial. O problema dos valores iniciais em que a superfície inicial é uma superfície característica é conhecido como «problema de Goursat» [54], e o desenvolveremos a seguir. Seja a seguinte equação diferencial em que a segunda derivada em relação à variável xm não pode ser isolada, pois não aparece; ou seja, a equação diferencial escrita em termos de coordenadas tais que a superfície xm = 0 é uma superfície característica (Amm = 0): (99) ∑ i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i = 1 m - 1 A i ⁢ i ⁢ ∂ 2 ⁡ u ∂ ⁡ x i 2 + ∑ i B i ⁢ ∂ ⁡ u ∂ ⁡ x i + c ⁢ u = f . Nosso primeiro propósito será ver se os dados iniciais que são suficientes no problema fora de superfícies características são também suficientes nesse caso. Suponhamos, pois, que sejam conhecidos: (100) u ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 0 ⁢ ( x 1 ; ⋯ ; x m - 1 ) ; ∂ ⁡ u ∂ ⁡ x m ⁢ ( x 1 ; ⋯ ; x m - 1 ; 0 ) = u 1 ⁢ ( x 1 ; ⋯ ; x m - 1 ) . Façamos, como anteriormente, a expansão ao redor de xm = 0: (101) u = u 0 + u 1 ⁢ x m + ⋯ + u h h ! ⁢ x m h + ⋯ ; u h = u h ⁢ ( x 1 ; ⋯ ; x m ) ≡ ∂ h ⁡ u ∂ ⁡ x m h | x m = 0 . Colocando essa expansão na equação (99), então avaliando em xm = 0, obtemos já não uma expressão para u2 como outrora obtivemos, mas uma equação diferencial para u1: (102) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u 1 ∂ ⁡ x i + B m ⁢ u 1 + H 1 = 0 , com H1 dependendo somente de u0 e suas derivadas: (103) H 1 = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u 0 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u 0 ∂ ⁡ x i + C ⁢ u 0 - f . Vemos, pois, que se u1 não for dado de forma a satisfazer essa equação diferencial, então o problema de valores iniciais com os dados iniciais da equação (100) não tem solução. Portanto, precisamos fornecer outros dados iniciais, a saber, os necessários para que as equações diferenciais que se obtêm para as funções uh possam ser univocamente solucionadas. A equação (102) é uma equação diferencial parcial de primeira ordem para u1. Vejamos se também as equações para os outros uh são desse tipo. Derivando a equação (99) h − 1 vezes em relação a xm e então tomando xm = 0, obtemos a equação diferencial para uh: (104) 2 ⁢ ∑ i ≠ m A i ⁢ m ⁢ ∂ ⁡ u h ∂ ⁡ x i + B m ⁢ u h + H h = 0 , com: (105) H h = ⁢ ∑ i ≠ m , k ≠ m , i ≠ k A i ⁢ k ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i ⁢ ∂ ⁡ x k + ∑ i ≠ m A i ⁢ i ⁢ ∂ 2 ⁡ u h - 1 ∂ ⁡ x i 2 + ∑ i ≠ m B i ⁢ ∂ ⁡ u h - 1 ∂ ⁡ x i + C ⁢ u h - 1 - ∂ h - 1 ⁡ f ∂ ⁡ x m h - 1 . Observamos que todas as equações diferenciais que se obtêm para as funções uh são de primeira ordem. Para solucioná-las, estudemos o método das características para esse tipo de equações. Para simplificar a exposição, além disso, consideremos o caso de duas variáveis e suponhamos que queremos resolver a equação: (106) A ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ x + B ⁢ ( x ; y ) ⁢ ∂ ⁡ u ∂ ⁡ y - C ⁢ ( x ; y ; u ) = 0 . As equações (104) são todas desse tipo, com a particularidade de ser A(x; y) = 0, o que colocaremos no final. Solucionar a equação (106) significa determinar uma solução u = z(x; y); essa superfície solução tem vetor normal n = (∂ z/∂ x;∂ z/∂ y; − 1); portanto, definindo o campo vetorial F = (A; B; C), a equação (106) pode ser escrita como: (107) F ⋅ n = 0 . Ou seja, F é tangente à superfície solução u = z(x; y), tendo como consequência que esta é constituída por curvas integrais daquela; tais curvas integrais são chamadas «curvas características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os valores de u(x; y) numa curva γ no plano x − y, cujo uso permite estabelecer a curva Γ sobre a superfície z(x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser gerada uma curva integral de F, construindo assim a superfície z(x; y). Levando a ideia à prática, podemos parametrizar, para a em algum domínio de variação: (108) Γ ( a ) = ( x = x 0 ( a ) ; y = y 0 ( a ) ; z = z 0 ( a ) ) . Determinar para cada valor de a uma curva integral de F que passe por Γ(a) significa resolver, para cada valor de a, o «sistema de equações diferenciais de Lagrange-Charpit»: Para um parâmetro s: (109) d ⁢ x d ⁢ s = A ⁢ ( x ; y ) ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) , (110) d ⁢ y d ⁢ s = B ⁢ ( x ; y ) ; y ⁢ ( 0 ) = y 0 ⁢ ( a ) , (111) d ⁢ z d ⁢ s = C ⁢ ( x ; y ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) . As soluções desse sistema, (112) x = X ⁢ ( a ; s ) , y = Y ⁢ ( a ; s ) , z = Z ⁢ ( a ; s ) , são já uma representação paramétrica da superfície solução. Para obtê-la na forma u = z(x; y), precisaremos inverter: (113) a = Λ ⁢ ( x ; y ) e s = S ⁢ ( x ; y ) , com o qual a solução buscada será: (114) u ⁢ ( x ; y ) = Z ⁢ ( Λ ⁢ ( x ; y ) ; S ⁢ ( x ; y ) ) . Vale ressaltar que para que possa ser gerada a superfície solução a partir da curva Γ por ação do campo vetorial F, é preciso que Γ não seja já uma curva característica –uma curva integral de F–, pois então ela seria invariante pela ação de F. Vejamos como isto funciona em nosso caso: As equações (104) dão lugar às equações de Lagrange-Charpit com o lado direito da equação (109) nulo: (115) d ⁢ x d ⁢ s = 0 ; x ⁢ ( 0 ) = x 0 ⁢ ( a ) . Isto é, x é independente do parâmetro s. Se os dados iniciais fossem dados numa linha de x = constante, então x seria também independente de a; logo não poderíamos obter a solução do sistema mais que para um valor constante de x. Concluimos: Os dados iniciais que são precisos para solucionar univocamente as equações (104) não podem ser dados na superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, se os dados iniciais estão na linha de y constante: (116) Γ = ( x = x 0 ( a ) ; y = y 0 ; z = z 0 ( a ) ) , com y0 independente de a. A equação (115) tem solução: x = x0(a). Substituíndo na equação (110), como x é independente de s, a integração se torna elementar: (117) s = ∫ y 0 y d ⁢ y B ⁢ ( x 0 ⁢ ( a ) ; y ) . Finalmente, a equação (111) será: (118) d ⁢ z d ⁢ s = C ⁢ ( x 0 ⁢ ( a ) ; y ⁢ ( a ; s ) ; z ) ; z ⁢ ( 0 ) = z 0 ⁢ ( a ) , que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução única. A análise recém realizada demonstra que as equações (104) que determinam as funções uh poderão ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por exemplo, com xk = constante, k ≠ m. Conclui-se que, quando o problema de valores iniciais está definido sobre uma superfície característica da equação diferencial, os dados iniciais não podem ser o valor da função e sua primeira derivada normal à superfície característica, pois em tal caso o problema pode não ter solução ou ter infinitas soluções. Em seu lugar, devem ser dados: o valor da função na superfície característica e o valor da função em uma superfície diferente dela. 3.3. Superfícies características da equação de Klein-Gordon-Fock Uma vez que temos visto que o problema de valores iniciais pode ser bem definido sobre superfícies características, apliquemos o conhecimento adquirido para a equação de Klein-Gordon-Fock com que iniciamos essa discusão [equação (56)]: (119) ∂ 2 ⁡ u ∂ ⁡ t 2 - ∂ 2 ⁡ u ∂ ⁡ x 2 - ∂ 2 ⁡ u ∂ ⁡ y 2 - ∂ 2 ⁡ u ∂ ⁡ z 2 + m 2 ⁢ u = 0 . Comparando com a equação (95), reconhecemos que para essa equação são6: (120) A μ ⁢ ν = η ~ μ ⁢ ν , B μ = 0 , C = m 2 e f = 0 . Aqui, η~μ⁢ν são as componentes do tensor métrico do espaço-tempo de Minkowski: (η~μ⁢ν)=diag⁢(+1;-1;-1;-1). A forma característica [vide a equação (97)] é aqui η~μ⁢ν⁢γμ⁢γν, que se anula para γμ um vetor tipo-luz: (121) ( γ 0 ) 2 = γ 2 . Assim sendo, a transformação de coordenadas Xμ = Gμ(t; x; y; z) será tal que X0 = constante é uma superfície característica se [vide a equação (98)] a função G0 satisfaz à equação diferencial: (122) ( ∂ ⁡ G 0 ∂ ⁡ t ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ x ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ y ) 2 - ( ∂ ⁡ G 0 ∂ ⁡ z ) 2 = 0 , cuja solução é: (123) G 0 = a ⁢ t + b ⁢ x + c ⁢ y + d ⁢ z ; a = ± b 2 + c 2 + d 2 . Isto é, as superfícies características da equação de Klein-Gordon-Fock são as superfícies X0 = 0, com: (124) X 0 ∼ t ± b ⁢ x + c ⁢ y + d ⁢ z b 2 + c 2 + d 2 , ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade com a coordenada X0, podendo ser arbitráriamente escolhidas. Façamos uma escolha: Definição: Sejam (x0; x1; x2; x3) coordenadas cartesianas no espaço-tempo de Minkowski tais que o tensor métrico adota sua forma diagonal normalizada η~μ⁢ν. O conjunto de coordenadas (x+; x1; x2; x-), com: (125) x + := 1 2 ⁢ ( x 0 + x 3 ) , x - := 1 2 ⁢ ( x 0 - x 3 ) , é chamado conjunto de coordenadas do plano nulo. □ A eleição da superfície característica em que os dados iniciais sejam dados, quer x+ = 0, quer x− = 0, é um assunto puramente convencional, mas importante por ser, implícitamente, uma eleição do parâmetro de evolução dos campos, que doravante chamaremos «tempo». Escolhemos x+ como coordenada temporal; a seguinte nomenclatura é usada: x− é a coordenada «longitudinal», e x⊥ = (x1; x2) são as coordenadas «transversais». As coordenadas cartesianas (x0; x1; x2; x3) passarão a ser chamadas «coordenadas instantâneas», por razões óbvias. O fator de proporcionalidade escolhido na definição de x± na equação (125) tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é igual à unidade, de forma que o elemento de volume não muda: (126) d 4 ⁢ x = d ⁢ x + ⁢ d ⁢ x - ⁢ d 2 ⁢ x ⊥ . Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte representação matricial: (127) [ η a ⁢ b ] = ( 0 0 0 1 0 - 1 0 0 0 0 - 1 0 1 0 0 0 ) = [ η a ⁢ b ] . Pelo proferido, concluímos que o problema de Goursat da equação de Klein-Gordon-Fock é o problema dos valores iniciais na dinâmica da frente de luz. E mais ainda: Essa é a única exceção à aplicabilidade do teorema de Cauchy-Kovalevskaya: É a única forma dinâmica na qual o problema dos valores iniciais não pode ser obtido por deformação da superfície inicial em alguma outra forma dinâmica. Passemos a estabelecer a solução do problema de Goursat da equação de Klein-Gordon-Fock. Para isso, lembremos da equação (88): Em coordenadas instantâneas: (128) u ⁢ ( x ) = ∫ y 0 = 0 d 3 ⁢ y ⁢ D ⁢ ( x - y ) ⁢ ∂ ↔ 0 y ⁢ u ⁢ ( y ) . Denotemos a versão tetra-vetorial do integrando por Nμ(x; y): (129) N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) . Tomando a divergência em relação à variável y, vemos que: (130) ∂ μ y ⁡ N μ ⁢ ( x ; y ) = D ⁢ ( x - y ) ⁢ □ y ⁢ u ⁢ ( y ) - □ y ⁢ D ⁢ ( x - y ) ⁢ u ⁢ ( y ) = 0 , pois tanto u como D satisfazem à equação de Klein-Gordon-Fock de massa m [vide a equação (84)]. Portanto, sendo de divergência nula, podemos usar o teorema de Gauss no volume Ω limitado pelo sólido A − B − C − D na Fig. 4 –compare-se essa figura com a 3–, em que o ponto P, vértice do cone de luz, representa o ponto x em que desejamos conhecer o valor do campo u. Então teremos que: Figura 4 Volume de integração para a obtenção da solução do problema de Goursat da equação de Klein-Gordon-Fock. (131) 0 = ∫ Ω d 4 ⁢ y ⁢ ∂ μ y ⁡ N μ ⁢ ( x ; y ) = ∫ ∂ ⁡ Ω d σ μ ⁢ ( y ) ⁢ N μ ⁢ ( x ; y ) = ( ∫ A - B + ∫ B - C + ∫ C - D + ∫ D - A ) × D ⁢ ( x - y ) ⁢ ∂ ↔ y μ ⁢ u ⁢ ( y ) ⁢ d ⁢ σ μ ⁢ ( y ) . Porém, B − C está fora do cone de luz do ponto P, e a integral nessa superfície se anula, pois D(x − y) tem suporte causal. Assim sendo, identificando a integral sobre A − B como a solução da equação (128) e reconhecendo que os vetores normais às superfícies C − D e D − A são, respectivamente, nas coordenadas do plano nulo, (0;0;0; − 1) e (− 1; 0; 0; 0), obteremos que: (132) u ⁢ ( x ) = ∫ D - A D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - + ∫ C - D D ⁢ ( x - y ) ⁢ ∂ ↔ + y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y + , visto que a superfície D − A é de x+ = constante e a C − D é de x− = constante. Isto é concordante com nossos estudos prévios: A solução ao problema de valores iniciais é única e bem definida se os dados iniciais são o valor do campo na superfície característica e o valor dele em uma superfície diferente da anterior. Em outras palavras, temos substituído o valor de u e ∂0u em um plano tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular, podemos fazer o limite em que a superfície C − D se encontra em x− → − ∞, e os dados iniciais nessa superfície são substituídos pela «condição assintótica» [14, 15]: (133) lim x - → - ∞ ⁡ u ⁢ ( x ) = 0 . Em tal caso, a solução da equação (132) se simplifica a: (134) u ⁢ ( x ) = ∫ y + = y 0 + D ⁢ ( x - y ) ⁢ ∂ ↔ - y ⁢ u ⁢ ( y ) ⁢ d 2 ⁢ y ⊥ ⁢ d y - , que precisa do conhecimento só do valor do campo na superfície isocrônica x+=x0+. ] pode ser fácilmente extendida para um campo Φ(x) que obedece a equações do tipo:

(238) + - Φ ( x ) = L Φ ( x ) + Ψ ( x ) ,

com L um operador diferencial linear que não contém derivadas temporais ∂+ e Ψ(x) um campo diferente do Φ(x). As equações (232) são desse tipo para ν = 1, 2 somente sob a condição de gauge do plano nulo. A equação para ν = + se equivale então à condição de gauge de Lorenz com A+ = 0 –sob as condições assintóticas que estamos usando–, e esta torna uma identidade a equação para ν = − . As duas condições de gauge, de qualquer forma, são compatíveis –no caso livre– e devem ser usadas simultâneamente.

No gauge do plano nulo, a densidade lagrangiana da equação (233) se simplifica a:

(239) A = + A - A + - A A - - 1 2 ( 1 A 2 - 2 A 1 ) 2 + 1 2 ( - A - ) 2 .

Ou ainda, em função das componentes dinâmicas só:

(240) A = + A - A + ( A α α ) ( β A β ) + 1 2 ( A ) 2 - 1 2 ( 1 A 2 - 2 A 1 ) 2 .

O tensor de energia-momento é:

(241) Θ = ν μ A ( μ A σ ) ν A σ - δ ν μ A = F ν σ μ A σ + 1 4 δ F σ τ ν μ F σ τ .

Particulamente, o hamiltoniano invariante no gauge do plano nulo é:

(242) H N P ; A = d 3 x ¯ [ 1 2 ( 1 A 2 - 2 A 1 ) 2 - - A A - - 1 2 ( - A - ) 2 ] .

Ou, escrito somente em função das componentes dinâmicas:

(243) H N P ; A = d 3 x ¯ [ 1 2 ( 1 A 2 - 2 A 1 ) 2 + 1 2 ( A ) 2 ] .

8.2. Problema de Goursat

O problema de Goursat para o campo eletromagnético possui uma consequência notável: Ele garante a preservação no tempo das condições de gauge. Com efeito, dada a equação (236), as componentes transversais têm a solução:

(244) A α ( x ) = y + = y 0 + d 3 y ¯ D 0 ( x - y ) - y A α ( y ) ,

com o subíndice «0» sob a distribuição de Jordan-Pauli indicando que nela a massa é nula: m = 0. Escrevamos a solução completa da forma:

(245) A a ( x ) = y + = y 0 + d 3 y ¯ D ( x - y ) b a - y A b ( y ) .

A equação (244) é recuperada sob a condição de ser:

(246) D = β α δ β α D 0 , D = - α 0 ,

enquanto que as condições de vínculo da equação (237) são satisfeitas, uma vez impostas no plano nulo y+=y0+, se:

(247) D = α + 0 , D = - + 0 , D = - - 0 , D = α - - 1 - α D 0 .

Nota-se que não é preciso exigirmos valores particulares de D+a, uma vez que imporemos que seja A+ = 0 no plano nulo inicial. Todas essas condições são satisfeitas com a escolha:

(248) D = b a ( δ b a - η a b + η b a - ) D 0 ( x ) ,
(249) ( η a ) = ( 0 ; 0 ; 1 ) .

Assim, se no plano y+=y0+ são impostas as condições de gauge de Lorenz e do plano nulo, então elas se manterão em todo tempo posterior na evolução dinâmica do campo.

8.3. Vetores de polarização

Já dissemos repetidamente que sob a condição de gauge de Lorenz cada componente do campo da radiação satisfaz a equação de Klein-Gordon-Fock:

(250) A a ( x ) = 0 .

Consequentemente, cada uma dessas componentes poderá ser expandida como uma integral de Fourier como na equação (179):

(251) A a ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) × λ ( ε λ ( p ¯ ) a * A ( λ ; p ¯ ) e - i p x + ε λ ( p ¯ ) a A ( λ ; p ¯ ) * e i p x ) | p + = E ,

comελ(p¯)a os vetores de polarização do campo (λ = + , ⊥, − ). Se eles são escolhidos reais, então a equação anterior se reduz à:

(252) A a ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) λ ε λ ( p ¯ ) a × ( A ( λ ; p ¯ ) e - i p x + A ( λ ; p ¯ ) * e i p x ) | p + = E .

O caráter vetorial do campo eletromagnético está, então, contido nos vetores de polarização e, portanto, (da mesma forma que acontecia com os espinores de polarização do campo de Dirac) devem carregar também a informação relativa aos vínculos impostos. Ora, como este campo possui somente dois graus de liberdade, também serão só dois os vetores de polarização dinâmicos; diremos que estes são aqueles com λ = 1, 2. As duas condições de gauge explicitadas na equação (237) são obtidas pelo uso dos vetores de polarização:

(253) ε 1 ( p ¯ ) a = ( 0 ; 1 ; 0 ; - p 1 p - ) , ε 2 ( p ¯ ) a = ( 0 ; 0 ; 1 ; - p 2 p - ) ,

cuja norma é:

(254) η a b ε α ( p ¯ ) a ε β ( p ¯ ) b = - δ β α ,

o que indica que estão normalizados e são do tipo-espaço. O cálculo direto então mostra que tais vetores de polarização físicos seguem a regra de soma:

(255) λ = 1, 2 ε λ ( p ¯ ) a ε λ ( p ¯ ) b = - η a b + p a η b + η a p b p - - p 2 p - 2 η a η b .

Isto estabelece uma relação importante com o problema de Goursat: Devido à igualdade p2δ(p2) = 0 [62], as equações (83) e (248) implicam que, no espaço dos momentos:

(256) D ^ a b ( p ) = - λ = 1, 2 ε λ ( p ¯ ) a ε λ ( p ¯ ) b D ^ 0 ( p ) .

Devemos finalmente nos ocupar da definição dos outros dois vetores de polarização, embora eles não se manifestem fisicamente. Como o conjunto dos quatro vetores hão de formar uma base para o espaço-tempo de Minkowski, requeriremos sua ortonormalidade –que é uma extensão da equação (254)–:

(257) η a b ε λ ( p ¯ ) a ε λ ( p ¯ ) b = η λ λ ,

equivalente à relação de completeza:

(258) λ λ η λ λ ε λ ( p ¯ ) a ε λ ( p ¯ ) b = η a b .

Digamos que sejam

(259) ε + ( p ¯ ) a = ( a ; b ; c ; d ) , ε - ( p ¯ ) a = ( e ; f ; g ; h ) .

As condições de serem ε+(p¯)aε+(p¯)a=0, ε1(p¯)a ε+(p¯)a=0 e ε2(p¯)aε+(p¯)a=0 levam a que, quer a ≠ 0 e

(260) ε + ( p ¯ ) a = a ( 1 ; - p 1 p - ; - p 2 p - ; p 2 2 p - 2 ) ,

quer a = 0 e

(261) ε + ( p ¯ ) a = ( 0 ; 0 ; 0 ; d ) .

Analogamente, as condições de serem ε-(p¯)aε-(p¯)a=0, ε1(p¯)aε-(p¯)a=0 e ε2(p¯)aε-(p¯)a=0 implicam que, quer e ≠ 0 e

(262) ε - ( p ¯ ) a = e ( 1 ; - p 1 p - ; - p 2 p - ; p 2 2 p - 2 ) ,

quer e = 0 e

(263) ε - ( p ¯ ) a = ( 0 ; 0 ; 0 ; h ) .

Evidentemente, somente poderá ser a ≠ 0 e e = 0, ou a = 0 e e ≠ 0, pois de outra forma os vetores serão proporcionais um ao outro. Qual dessas duas possibilidades deve ser usada, é impossível dizê-lo; é matéria de escolha. Escolheremos a primeira. Então a condição de ser ε+(p¯)aε-(p¯)a=1 implica que: ah = 1, cuja mais simples solução é: a = 1 = h. Os vetores de polarização não-dinâmicos serão portanto:

(264) ε + ( p ¯ ) a = ( 1 ; - p 1 p - ; - p 2 p - ; p 2 2 p - 2 ) ,
(265) ε - ( p ¯ ) a = ( 0 ; 0 ; 0 ; 1 ) .

9. Campo vetorial massivo

Por fim, consideremos o campo vetorial massivo real19 Ba(x), e estabeleçamos para ele a densidade lagrangiana de Proca:

(266) B = - 1 4 F a b F a b + m 2 B a B a ,

com:

(267) F a b := a B b - b B a .

As equações do movimento do campo são, portanto:

(268) b F b a + m 2 B a = 0 ,

e o tensor de energia-momento que lhe é associado:

(269) Θ = ν μ F ν σ μ B σ + 1 4 δ ν μ F σ τ F σ τ - 1 2 δ ν μ m 2 B σ B σ .

9.1. Problema de Goursat

Nota-se, contudo, que o tensor Fab é antissimétrico, do que decorre que a aplicação da derivada ∂a à equação (268) leva imediatamente ao cumprimento da condição:

(270) a B a ( x ) = 0 ,

cuja substituição na equação (268) implica que as equações do movimento são as equações de Klein-Gordon-Fock de cada uma das componentes:

(271) ( + m 2 ) B a ( x ) = 0 .

O conjunto das equações (270) e (271) é assim equivalente à equação (268). Em consequência, como tais componentes estão relacionadas pelo vínculo da equação (270), somente três componentes do campo vetorial massivo serão independentes, enquanto que a outra será determinada por eles. Mas a diferença do campo eletromagnético, como a densidade lagrangiana não possui a invariância de calibre, nenhuma outra condição subsidiária pode ser imposta; em particular, a componente B+(x) não pode ser anulada, e o vínculo não é cinemático, pois inclui uma derivada temporal. Assim, o vínculo bem pode ser entendido como uma equação dinâmica para a componente B+(x):

(272) + B + ( x ) = - α B α ( x ) - - B - ( x ) .

Essa equação não substitui a equação de Klein-Gordon-Fock para a componente B+, pois ela não é identicamente satisfeita, uma vez que Bα, B verificam a mencionada equação. Em seu lugar, o vínculo torna essa em uma equação não-dinâmica:

(273) ( 2 - m 2 ) B + ( x ) = - 2 - ( α B α + - B - ) ,

cuja solução é única uma vez impostas as condições assintóticas de desvanecimento de B+(x) no infinito das variáveis x. Em particular, é claro que as condições assintóticas tanto nessas direções como na direção da variável x serão implicadas por aquelas impostas às componentes Bα e B. Portanto, não é necessário fornecer dados iniciais para a componente B+, que são consequência da equação (273).

Com a análise anterior provamos que o número de dados iniciais requeridos é igual a seis: Os valores das componentes Bα e B nas superfícies características –ou na superfície inicial e condições assintóticas na variável x–. A solução ao problema de Goursat pode então ser escrita da seguinte forma:

(274) B + ( x ) = B + ( x 0 + ; x ¯ ) - x 0 + x + d y + ( α B α + - B - ) ( y + ; x ¯ ) ,
(275) B α , - ( x ) = y + = x 0 + d 3 y ¯ D ( x - y ) - y B α , - ( y ) ,

com B+(x0+,x¯) a solução à equação (273) em x+=x0+. Contudo, essa forma da solução tem a desagradável desvantagem de não ser covariante. Por esse motivo, é preferível escrever a solução da seguinte forma:

(276) B a ( x ) = y + = x 0 + d 3 y ¯ D ( x - y ) b a - y B b ( y ) ,

com D(x)ba escolhido de sorte que as equações (270) e (271) sejam satisfeitas. Evidentemente, para isso é suficiente que sejam cumpridas: (+m2)D(x)ba=0 e aD(x)ba=0, o que é verificado por:

(277) D ( x ) b a = ( δ b a + a b m 2 ) D ( x ) .

A forma assim escrita é compatível com o número de dados iniciais requeridos: Embora pareça que precisamos conhecer B+ na superfície inicial para colocá-la no lado direito da equação (276), ela ainda pode ser determinada com o mero conhecimento de Bα e B em dita superfície, pois as equações (276) e (277) ainda implicam a equação (273).

9.2. Vetores de polarização

Como cada componente do campo vetorial massivo satisfaz a equação de Klein-Gordon-Fock, poderemos escrever, já escolhendo os vetores de polarização ελ(p¯)a reais:

(278) B a ( x ) = ( 2 π ) - 3 / 2 d 3 p ¯ | 2 p - | Θ ( p - ) λ ε λ ( p ¯ ) a × ( B ( λ ; p ¯ ) e - i p x + B ( λ ; p ¯ ) * e i p x ) | p + = E .

Como outrora fizemos para o campo eletromagnético, é mister também agora definir os vetores de polarização com a finalidade de satisfazer aos vínculos impostos. Para satisfazer ao vínculo ∂aBa(x) = 0 é necessário escolher os três vetores de polarização físicos, que denotaremos εj(p¯)a (j = 1, 2, 3), tais que:

(279) p a ε j ( p ¯ ) a = 0 .

Daqui, os vetores de polarização físicos deverão ser da forma:

(280) ε j ( p ¯ ) a = ( δ b a - p a p b m 2 ) θ j ( p ¯ ) b ,

com θj(p¯)b vetores linearmente independentes escolhidos de forma que a norma dos vetores de polarização seja igual à unidade. Claramente, desde que o momento pa é do tipo-tempo –por se tratar de um campo massivo–, os vetores de polarização serão do tipo-espaço, e então sua norma, exigiremos, é igual a –1. Escolhemos portanto os três vetores θja na direção dos eixos espaciais20:

(281) θ 1 a ( 0 ; 1 ; 0 ; 0 ) , θ 2 a ( 0 ; 0 ; 1 ; 0 ) , θ 3 a ( 1 ; 0 ; 0 ; - 1 ) .

Os vetores de polarização normalizados que obtemos são:

(282) ε 1 ( p ¯ ) a = ( 1 + p 1 2 m 2 ) - 1 × ( - p - p 1 m 2 ; 1 + p 1 2 m 2 ; p 2 p 1 m 2 ; - p + p 1 m 2 ) ,
(283) ε 2 ( p ¯ ) a = ( 1 + p 2 2 m 2 ) - 1 × ( - p - p 2 m 2 ; p 1 p 2 m 2 ; 1 + p 2 2 m 2 ; - p + p 2 m 2 ) ,
(284) ε 3 ( p ¯ ) a = ( 1 + ( p + - p - ) 2 2 m 2 ) - 1 × ( 1 2 - p - ( p + - p - ) 2 m 2 ; p 1 ( p + - p - ) 2 m 2 ; p 2 ( p + - p - ) 2 m 2 ; - 1 2 - p + ( p + - p - ) 2 m 2 ) .

Estes três vetores geram o espaço tri-dimensional ortogonal ao momento pa. O vetor de polarização não físico, evidentemente, deverá ser definido ao longo de tal vetor:

(285) ε 0 ( p ¯ ) a = p a m .

A regra de soma para os vetores de polarização físicos é agora:

(286) j = 1 3 ε j ( p ¯ ) a ε j ( p ¯ ) b = - η a b + p a p b m 2 .

Como alhures encontramos para o campo eletromagnético, essa regra de soma está intimamente relacionada com o problema de Goursat: Comparando as equações (277) e (286) vemos que no espaço dos momentos:

(287) D ^ a b ( p ) = - j = 1 3 ε j ( p ¯ ) a ε j ( p ¯ ) b D ^ ( p ) .

10. Discussão e conclusões

Apresentamos, detalhadamente, a teoria de campos clássicos livres na dinâmica do plano nulo, surgida como a possibilidade mais conveniente, desde a perspectiva hamiltoniana, dentre as diversas formas dinâmicas relativísticas. Porém, vimos que os planos nulos são precisamente as superfícies características da equação de Klein-Gordon-Fock, constituíndo justamente o único caso em que sua solução é diferente daquela da dinâmica instantânea, pois a hipótese do teorema de Cauchy-Kovalevskaya não se lhe aplica. Contudo, mostramos que esta possibilidade é de fato realizável para os diferentes campos: escalar, fermiônico, eletromagnético e vetorial massivo. Em todos os casos determinamos a solução única dependente apenas dos dados iniciais, que agora devem ser: o valor do campo na superfície inicial x+ = constante e a condição assintótica de desvanecimento do campo no infinito da variável x. Encontramos também para estes campos o gerador de translações no tempo x+ (hamiltoniano no plano nulo) e fizemos um estudo a respeito de suas componentes dinâmicas e não dinâmicas, relacionadas sempre por equações de vínculo em virtude das quais foram determinados os vetores (ou espinores, no caso fermiônico) de polarização dos campos.

Com os procedimentos e resultados expostos temos estabelecido as bases da teoria de campos no plano nulo. A utilidade dela será encontrada, por exemplo, na teoria conforme. Tal estudo, assim como o das interações entre os campos no plano nulo, que apresentará peculiaridades devido à presença de termos «instantâneos», será abordado em um próximo artigo. Igualmente, temos como perspectiva abordar a quantização dos campos no plano nulo que aqui estudamos classicamente, visto que a teoria quântica de campos no plano nulo é uma ferramenta poderosa no estudo da física hadrônica.

Agradecimentos

O.A.A. agradece à CAPES pelo apoio financeiro total; K.P.G. e B.M.P. agradecem ao CNPq pelo apoio financeiro total e parcial, respectivamente. G.E.R.Z. agradece ao Sistema de Investigaciones – Universidad de Nariño.

A. Álgebra de Poisson das quantidades fundamentais

Demonstraremos nesse apêndice que a álgebra das quantidades fundamentais é a álgebra do grupo de Poincaré. Consideremos primeiramente a ação de duas transformações consecutivas, caracterizadas pelos geradores F1 e F2. A variável dinâmica ξ muda então para –mantendo termos até de ordem F1F2, mas desconsiderando as da ordem F12 e F22–:

(288) ξ = ξ + { ξ ; F 1 } + { ξ ; F 2 } + { { ξ ; F 2 } ; F 1 } .

Se as transformações forem aplicadas na ordem inversa, isto é, primeiro F2 e depois F1, a variável dinâmica teria se tornado:

(289) ξ * * = ξ + { ξ ; F 1 } + { ξ ; F 2 } + { { ξ ; F 1 } ; F 2 } .

Dessas equações, a identidade de Jacobi expressa na equação (4) leva a que a diferença entre a aplicação das transformações em uma ordem ou em outra é igual a:

(290) ξ * * - ξ = { ξ ; { F 1 ; F 2 } } .

Portanto, o comutador das pequenas variações da variável dinâmica se relaciona com o colchete de Poisson dos geradores das transformações correspondentes. Assim é que poderemos estabelecer a álgebra de colchetes de Poisson entre os geradores P e M das transformações de Poincaré, uma vez que conhecemos a ação deles nas coordenadas. Comecemos por ver que, segundo as equações (5), (6) e (7):

(291) a μ + b μ ν x ν = - a ρ { x μ ; P ρ } + 1 2 b ρ σ { x μ ; M ρ σ } ,

cuja solução é:

(292) { x μ ; P ρ } = - δ ρ μ , { x μ ; M ρ σ } = δ ρ μ x σ - δ σ μ x ρ .

Definamos agora os geradores:

F 1 = - P μ a μ + 1 2 M μ ν b μ ν , F 2 = - P ρ a ρ + 1 2 M ρ σ b ρ σ ,

cujo comutador é:

(293) { F 1 ; F 2 } = a μ a ρ { P μ ; P ρ } - 1 2 a μ b ρ σ { P μ ; M ρ σ } - 1 2 a ρ b μ ν { M μ ν ; P ρ } + 1 4 b μ ν b ρ σ { M μ ν ; M ρ σ } .

Por outro lado, as transformações de coordenadas correspondentes, aplicadas sucessivamente, levam, via a equação (6), a:

x τ = x τ + ( a τ + a τ + b τ η a η ) + ( b τ λ + b τ λ + b b η λ η τ ) x λ , x * * τ = x τ + ( a τ + a τ + b τ η a η ) + ( b τ λ + b τ λ + b b η λ η τ ) x λ ,

e obtemos:

(294) x * * τ - x τ = b τ η a η - b τ η a η + ( b b η λ η τ - b b η λ η τ ) x λ .

O lado direito dessa equação, tal como o ditam as equações (290) e (293), deverá igualarse a:

(295) a μ a ρ { x τ ; { P μ ; P ρ } } - 1 2 a μ b ρ σ { x τ ; { P μ ; M ρ σ } } - 1 2 a ρ b μ ν { x τ ; { M μ ν ; P ρ } } + 1 4 b μ ν b ρ σ { x τ ; { M μ ν ; M ρ σ } } .

E dessa igualdade, por meio da equação (292), obtém-se a álgebra de colchetes de Poisson dos geradores das transformações de Poincaré contida nas equações (8)–(10).

B. Matrizes de Dirac no plano nulo

Na representação de Weyl as matrizes de Dirac são:

(296) γ 0 = ( 0 2 1 2 1 2 0 2 ) , γ k = ( 0 2 - σ k σ k 0 2 ) ,

com σk as matrizes de Pauli:

(297) σ 1 = ( 0 1 1 0 ) , σ 2 = ( 0 - i i 0 ) , σ 3 = ( 1 0 0 - 1 ) .

Assim, temos que as matrizes γ±, definidas segundo:

(298) γ ± := 1 2 ( γ 0 ± γ 3 ) ,

têm a seguinte forma explícita, na representação em uso:

(299) γ + = ( 0 0 0 0 0 0 0 2 2 0 0 0 0 0 0 0 ) , γ - = ( 0 0 2 0 0 0 0 0 0 0 0 0 0 2 0 0 ) .

Os projetores Λ± definidos na equação (190) são portanto:

(300) Λ + = ( 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 ) , Λ - = ( 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 ) .

Referências

  • 1. A. Einstein, Ann. der Phys. 17, 891 (1905).
  • 2. H. Lorentz, A. Einstein e H. Minkowski, Textos Fundamentais da Física Moderna. I Volume: O Princípio da Relatividade (Fundação Calouste Gulbenkian, Lisboa, 2001), 5a ed.
  • 3. H. Poincaré, Science and Hypothesis (The Walter Scott publishing Co., Londres, 1905).
  • 4. A.A. Logunov, arXiv:physics/0408077 (2004).
  • 5. W. Rindler, Relativity. Special, General and Cosmological (Oxford University Press, Nova Iorque, 2006), 2a ed.
  • 6. P.A.M. Dirac, Rev. Mod. Phys. 21, 392 (1949).
  • 7. G.E. Ramos, Teoria de Campos no Plano Nulo: Um estudo . Dissertação de Mestrado, Universidade Estadual Paulista Júlio de Mesquita Filho, São Paulo (2005).
  • 8. G.E. Ramos, Formulação Canônica no Plano Nulo . Tese de Doutorado, Universidade Estadual Paulista Júlio de Mesquita Filho, São Paulo (2009).
  • 9. H. Bacry, P. Combe e P. Sorba, Rep. Math. Phys. 5, 145 (1974).
  • 10. H. Bacry, P. Combe e P. Sorba, Rep. Math. Phys. 5, 361 (1974).
  • 11. J. Patera, P. Winternitz e H. Zassenhaus, J. Math. Phys. 16, 1597 (1975).
  • 12. J. Patera, R. Sharp, P. Winternitz e H. Zassenhaus, J. Mark Phys. 17, 977 (1976).
  • 13. H. Leutwyler e J. Stern, Ann. Phys. 112, 94 (1978).
  • 14. F. Rohrlich, Acta Phys. Austriaca 32, 87 (1970).
  • 15. F. Rohrlich, Acta Phys. Austriaca Suppl. VIII, 277 (1971).
  • 16. S.J. Brodsky, H.C. Pauli e S.S. Pinsky, Phys. Rep. 301, 299 (1998).
  • 17. S. Fubini e G. Furlan, Physics Physique Fizika 1, 299 (1965).
  • 18. S. Weinberg, Phys. Rev. 150, 1313 (1966).
  • 19. H. Bebié e H. Leutwyler, Phys. Rev. Lett. 19, 618 (1967).
  • 20. R.A. Neville, Quantum Electrodynamics in a Laser Pulse . Tese de Doutorado, Syracuse University, Syracuse (1968).
  • 21. R.A. Neville e F. Rohrlich, Phys. Rev. D 3, 1692 (1971).
  • 22. S.J. Chang e S. Ma, Phys. Rev. 180, 1506 (1969).
  • 23. J.B. Kogut e D.E. Soper, Phys. Rev. D 1, 2901 (1970).
  • 24. R.A. Neville e F. Rohrlich, Nuovo Cimento 1, 625 (1971).
  • 25. H. Leutwyler, J.R. Klauder e L. Streit, Nuovo Cimento LXVI A, 536 (1970).
  • 26. J.H. Ten Eyck, Problems in Null-Plane Quantum-Electrodynamics . Tese de Doutorado, Syracuse University, Syracuse (1973).
  • 27. J.H. Ten Eyck e F. Rohrlich, Phys. Rev. D 9, 2237 (1974).
  • 28. S.J. Chang, R.G. Root e T.M. Yan, Phys. Rev. D 7, 1133 (1973).
  • 29. S.J. Chang e T.M. Yan, Phys. Rev. D 7, 1147 (1973).
  • 30. T.M. Yan, Phys. Rev. D 7, 1760 (1973).
  • 31. T.M. Yan, Phys. Rev. D 7, 1780 (1973).
  • 32. S.J. Brodsky, R. Roskies e R. Suaya, Phys. Rev. D 8, 4574 (1973).
  • 33. S.D. Drell, D. Levy e T.M. Yan, Phys. Rev. 187, 2159 (1969).
  • 34. S.D. Drell, D. Levy e T.M. Yan, Phys. Rev. D 1, 1035 (1970).
  • 35. S.D. Drell, D. Levy e T.M. Yan, Phys. Rev. D 1, 1617 (1970).
  • 36. S.D. Drell e T.M. Yan, Phys. Rev. Lett. 24, 181 (1970).
  • 37. E.P. Biernat, W.H. Klink e W. Schweiger, Few-Body Syst. 49, 149 (2011).
  • 38. R. Casana, B.M. Pimentel e G.E.R Zambrano, Braz. J. Phys. 44, 398 (2014).
  • 39. T. Maskawa e K. Yamawaki, Progr. Theor. Phys. 56, 270 (1976).
  • 40. H.C. Pauli e S.J. Brodsky, Phys. Rev. D 32, 1993 (1985).
  • 41. H.C. Pauli e S.J. Brodsky, Phys. Rev. D 32, 2001 (1985).
  • 42. E. Tomboulis, Phys. Rev. D 8, 2736 (1973).
  • 43. A. Casher, Phys. Rev. D 14, 452 (1976).
  • 44. B.M. Pimentel, A.T. Suzuki e G.E.R. Zambrano, Few-Body Syst. 52, 437 (2012).
  • 45. B.L.G. Bakker, A. Bassetto, S.J. Brodsky, W. Broniowski, S. Dalley, T. Frederico e T. Heinzl, Nuclear Phys. B (Proc. Suppl.) 251–252, 165 (2014).
  • 46. D. Bhamre, A. Misra e V.K. Singh, Few Body Syst. 59, 107 (2018).
  • 47. A.T. Suzuki e T.H.O. Sales, arXiv:hep-th/0408135 (2004).
  • 48. L. Landau e E. Lifshitz, Course of Theoretical Physics. Vol. 1. Mechanics (Butterworth-Heinemann, Oxford, 1976), 3 ed.
  • 49. L. Landau e E. Lifchitz, Curso de Física. Mecânica (Hemus, São Paulo, 2002).
  • 50. C. Lämmerzahl, J. Math. Phys. 34, 3918 (1993).
  • 51. J. Hadamard, Lectures on Cauchy’s Problem in Linear Partial Differential Equations (Yale University Press, New Haven, 1923).
  • 52. E. Goursat, A Course in Mathematical Analysis. Vol. I (Ginn and Company, Boston, 1904).
  • 53. N.N. Bogoliubov e D. Shirkov, Introduction to the theory of Quantized Fields (John Wiley & Sons – Interscience Publishers, Nova Iorque, 1979), 3 ed.
  • 54. A.N. Tíjonov e A.A. Samarsky, Ecuaciones de la física matemática (Editorial Mir Moscú, Moscou, 1972).
  • 55. S. Chandrasekhar, The Mathematical Theory of Black Holes (Oxford University Press, Oxford, 2006).
  • 56. E. Gourgoulhon, Special Relativity in General Frames. From Particles to Astrophysics (Springer-Verlag, Heidelberg, 2013).
  • 57. F.G. Friedlander e M. Joshi, Introduction to the theory of distributions (Cambridge University Press, Cambridge, 1998), 2 ed.
  • 58. A.G. Sveshnikov e A.N. Tikhonov, The Theory of Functions of a Complex Variable (Mir Publishers, Moscou, 1971).
  • 59. N.P. Konopleva e V.N. Popov, Gauge Fields (Harwood academic publishers, Amsterdã, 1981).
  • 60. L. Landau e E. Lifshitz, Course of Theoretical Physics. Vol. 2. The Classical Theory of Fields (Butterworth-Heinemann, Oxford, 1980), 4 ed.
  • 61. L. Landau e E. Lifchitz, Curso de Física. Teoria do campo (Hemus, São Paulo, 2002).
  • 62. L. Schwartz, Mathematics for the Physical Sciences (Addison-Wesley Publishing Company, Paris, 1966), 2 ed.
  • 63. J. Hilgevoord, Dispersion Relations and Causal Description (North Holland, Amsterdã, 1960).
  • 64. R. Casana, B.M. Pimentel e G.E.R. Zambrano, Revista Colombiana de Física 41, 220 (2009).
  • 1
    O fato dessa inclinação ter de ser não-negativa tem origem no axioma de invariância da causalidade [5]: Seu sentido de futuro não pode mudar qualquer que seja sua velocidade.
  • 2
    Algumas vezes chamada «dinâmica do cone de luz» [16], mas esse nome não é apropriado pois o cone de luz, já o dissemos, é um caso particular que corresponde à dinâmica forma-ponto, e não deve ser confundida com a dinâmica da frente de luz.
  • 3
    Para solucionar o assim chamado «problema do modo zero».
  • 4
    Naquela época, é mister dizer, a formulação hamiltoniana era imprescindível para a transição da teoria clássica à quântica –assim o apontou Dirac explícitamente–; na atualidade tal restrição não rege mais e é perfeitamente possível formular a teoria quântica desde a abordagem lagrangiana ou ainda diretamente a partir das equações do movimento dos campos.
  • 5
    Recordamos que a forma característica define o tipo de equação diferencial parcial da segunda ordem [54]: (i) Se ela contém m autovalores diferentes não nulos do mesmo sinal, como acontece, por exemplo, com a equação de Laplace ∇2 φ = 0, ela se chama «elíptica»; (ii) se tem menos de m autovalores não nulos, como acontece com a equação de Schrödinger ∂t ψ + ∇2 ψ = 0, ela se chama «parabólica»; (iii) se tem m autovalores não nulos, não todos do mesmo sinal, como acontece com a equação de Klein-Gordon-Fock [equação (69)], então a equação diferencial denomina-se «hiperbólica». Particularmente, se na equação hiperbólica a forma característica tem todos os autovalores do mesmo sinal, exceto um, então ela se chama «hiperbólica normal»; é a esse tipo que pertence a equação de Klein-Gordon-Fock.
  • 6
    Colocamos agora índices gregos por se tratar de índices do espaço-tempo.
  • 7
    É claro, uma transformação de coordenadas não oferece nenhuma diferença importante, pois as equações do movimento na teoria da relatividade tem caráter tensorial e são, portanto, covariantes frente a transformações gerais de coordenadas.
  • 8
    A forma integral aqui é devida a que, no caso geral de se utilizar coordenadas curvas, o simples produto e~xμμ(a) pode não fornecer a informação desejada. Tal produto será suficiente, por outra parte, se as coordenadas xμ estão definidas ao longo de eixos retos.
  • 9
    Essa solução é tomada assim por compatibilidade com a definição das coordenadas no plano nulo dada na equação (125).
  • 10
    Este é um vetor no espaço-tempo de Minkowski só uma vez que a origem –por exemplo, a posição do observador ou um evento particularmente escolhido– tem sido fixado. Isto é devido ao caráter afim e não simplesmente linear dele. A respeito deste ponto, consultar a Ref. [56].
  • 11
    O motivo dela é a simplificação dos geradores do grupo de Poincaré quando escritos em função das amplitudes φ(p); tal normalização se torna importante na teoria quântica, pois determina as relações de comutação dos operadores de emissão e absorção; isto, no entanto, não será discutido no artigo presente.
  • 12
    A definição do adjunto de Dirac ψ¯ é obtida da forma que segue: A equação de Dirac nas coordenadas do plano nulo é:
    [ i ( γ + + + γ - - + γ ) - m ] ψ ( x ) = 0 .
    Tomando o adjunto no espaço das matrizes (isto é, o complexo conjugado seguido pela transposição), as derivadas, sendo reais, não mudam: a=a (a = +, ⊥, − ). Por outro lado: (γa) = γ0γaγ0 (a = +, ⊥, − ), de forma que a equação muda para (fatorando o sinal negativo, então removendo-o):
    ψ ( x ) [ i ( γ 0 γ + γ 0 + + γ 0 γ - γ 0 - + γ 0 γ γ 0 ) + m ] = 0 .
    Multiplicando pela direita por γ0 e usando que (γ0)2 = 1:
    ψ ( x ) γ 0 [ i ( γ + + + γ - - + γ ) + m ] = 0 ,
    do qual concluímos que o espinor adjunto de Dirac na dinâmica da frente de luz continúa a ser:
    ψ ¯ ( x ) := ψ ( x ) γ 0 .
  • 13
    A expressão das matrizes de Dirac no plano nulo e na representação de Weyl é mostrada no apêndice B B. Matrizes de Dirac no plano nulo Na representação de Weyl as matrizes de Dirac são: (296) γ 0 = ( 0 2 1 2 1 2 0 2 ) , γ k = ( 0 2 - σ k σ k 0 2 ) , com σk as matrizes de Pauli: (297) σ 1 = ( 0 1 1 0 ) , σ 2 = ( 0 - i i 0 ) , σ 3 = ( 1 0 0 - 1 ) . Assim, temos que as matrizes γ±, definidas segundo: (298) γ ± := 1 2 ⁢ ( γ 0 ± γ 3 ) , têm a seguinte forma explícita, na representação em uso: (299) γ + = ( 0 0 0 0 0 0 0 2 2 0 0 0 0 0 0 0 ) , γ - = ( 0 0 2 0 0 0 0 0 0 0 0 0 0 2 0 0 ) . Os projetores Λ± definidos na equação (190) são portanto: (300) Λ + = ( 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 ) , Λ - = ( 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 ) . .
  • 14
    O mesmo que na normalização das amplitudes do campo escalar na equação (181), essa escolha é livre –faça o leitor a escolha que lhe aprouver–. Se refletirá, por exemplo, nas regras de soma que estamos prestes a obter [vide as equações (220) e (227)].
  • 15
    Mais detalhes podem ser encontrados, por exemplo, na seção 18 das Refs. [60, 61].
  • 16
    Essa condição de gauge é sempre atingível: Seja g(x) = ∂μAμ(x). O campo A′⁣ μ = Aμ + ∂μ f satisfará à condição de gauge de Lorenz se a função f(x) é escolhida de forma a satisfazer a equação: □ f(x) = − g(x).
  • 17
    Na nota de rodapé anterior, a função f(x) está determinada módulo soluções à equação homogênea □ f(x) = 0.
  • 18
    É mister mencionar também que ela é sempre atingível: Se o campo Aa(x) não a satisfaz, operamos a transformação A′⁣ a(x) = Aa(x) + ∂a f(x), com: f(x)=-1-A+(x). Então a equação (235) rege para o campo A′⁣ a(x).
  • 19
    Não se deve pensar que essa seja uma restrição, pois bem se conhece que o campo complexo pode ser considerado como uma combinação linear complexa de dois campos reais; a análise só requeriria incrementar o número de campos reais seguindo o mesmo procedimento que aqui mostraremos para cada um deles.
  • 20
    Essa é apenas uma escolha na multiplicidade de possibilidades.

Datas de Publicação

  • Publicação nesta coleção
    09 Ago 2021
  • Data do Fascículo
    2021

Histórico

  • Recebido
    28 Maio 2021
  • Revisado
    30 Jun 2021
  • Aceito
    04 Jul 2021
location_on
Sociedade Brasileira de Física Caixa Postal 66328, 05389-970 São Paulo SP - Brazil - São Paulo - SP - Brazil
E-mail: marcio@sbfisica.org.br
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro