Oi Rodrigo, tudo bem?
Realmente existiam vários programas para Tracking antigamente e agora só resta o Syntheyes.
O MatchMover foi comprado pela Autodesk e como sempre, mataram logo em seguida, até distribuiram uma versão gratuita na época, mas depois nunca mais ouviu falar dele.
O Boujour desapareceu pouco tempo depois, mas o Syntheyes continua sendo desenvolvido, eu não posto mais estas notícias porque são poucos os interessados.
As câmeras profissionais passaram a ter sensores de movimento, então, normalmente os desenvolvedores oferecem Scripts para transferir os dados para os Softs 3D e de composição, hoje tem sensores até nos celulares.
Além disso, a tecnologia de Tracking se tornou mais comum passou a fazer parte de diversos Softs de composição, até mesmo do After Effects, então, as pessoas continuam usando, apenas não tem mais programas dedicados só para isso, exceto o Syntheyes.
Para levar para o Max é só exportar a câmera ou os dados do movimento dependendo da fonte, mas como disse, geralmente os Softs oferecem Scripts para isso.
Já no Unreal, além de poder importar a câmera ou os dados do movimento igual antigamente, ele tem um Plug-in nativo, chamado VCam, para controlar a câmera 3D através da câmera do celular e ao vivo em tempo real, então, o Tracking acontece imediatamente e você já vê o resultado direto na Viewport, também tem recursos para transmitir o vídeo ao vivo e dai você pode aplicar em qualquer objeto, mas tem um objeto próprio para isso, chamado Image Plate, que se ajusta ao Frustum da câmera 3D.
Atualmente, em produção virtual, a câmera real transfere o movimento em Real-Time para a câmera 3D, que exibe a cena 3D realista num telão de LED gigante, enquanto os atores e objetos em primeiro plano são filmados com a câmera real, que tem o mesmo movimento da câmera 3D, ou seja, não usam mais aquele lance de Chroma Key para recortar depois na composição porque já sai composto diretamente na gravação da câmera real.
Isso também ajudou muito iluminar a cena corretamente de acordo com o ambiente, pois na verdade não é apenas um telão, são vários envolvendo a cena de todos os lados e também de cima, desta forma, a cena já fica iluminada de acordo com o ambiente exibido nos telões, por exemplo, o telão de cima exibe apenas o céu, enquanto os laterais exibem a paisagem, entende?
O Unreal que separa e define o que aparece aonde, ele tem um recurso chamado nDisplay para isso.
Se tem uma coisa que mudou muito depois do surgimento do Unreal foi a produção de vídeo, nas outras áreas ele adicionou possibilidades e facilidades, mas em produção de vídeo mudou completamente a forma de fazer o trabalho.
Abração e tudo de bom.
André Vieira