banner

blog

Sep 02, 2023

ALICE melhora seu jogo para computação sustentável

A concepção e implementação de um modelo de computação completamente novo – o projecto O2 – permite à colaboração ALICE fundir o processamento de dados online e offline numa única estrutura de software para lidar com as exigências do Run 3 e além. Volker Lindenstruth vai aos bastidores.

O Grande Colisor de Hádrons (LHC) voltou à vida em 5 de julho de 2022, quando as colisões próton-próton com uma energia recorde de centro de massa de 13,6 TeV foram retomadas para a 3ª execução. Desta e de futuras execuções do LHC, o experimento ALICE passou por uma grande atualização durante o Long Shutdown 2 (2019–2022) que irá melhorar substancialmente a reconstrução da pista em termos de precisão espacial e eficiência de rastreamento, em particular para partículas de baixo momento. A atualização também permitirá uma taxa de interação aumentada de até 50 kHz para colisões chumbo-chumbo (PbPb) no modo de leitura contínua, o que permitirá ao ALICE coletar uma amostra de dados mais de 10 vezes maior do que as amostras combinadas da Execução 1 e Execução 2. .

ALICE é um experimento único no LHC dedicado ao estudo da matéria nuclear extrema. É composto por um barril central (o maior produtor de dados) e um “braço” de múon direto. O barril central depende principalmente de quatro subdetectores para rastreamento de partículas: o novo sistema de rastreamento interno (ITS), que é um rastreador de silício monolítico de sete camadas e 12,5 gigapixels (CERN Courier julho/agosto de 2021, p29); uma câmara de projeção de tempo (TPC) atualizada com leitura baseada em GEM para operação contínua; um detector de radiação de transição; e um detector de tempo de voo. O braço de múons é composto por três dispositivos de rastreamento: um rastreador direto de múons recém-instalado (um rastreador de silício baseado em sensores de pixel ativos monolíticos), câmaras de múons renovadas e um identificador de múons.

Devido ao aumento do volume de dados no detector ALICE atualizado, é impossível armazenar todos os dados brutos produzidos durante a Execução 3. Uma das principais atualizações do ALICE em preparação para a execução mais recente foi, portanto, o design e a implantação de um modelo de computação completamente novo: o projeto O2, que mescla processamento de dados online (síncrono) e offline (assíncrono) em uma única estrutura de software. Além de uma atualização dos parques computacionais do experimento para leitura e processamento de dados, isso exige uma compactação on-line eficiente e o uso de unidades de processamento gráfico (GPUs) para acelerar o processamento.

Como o próprio nome indica, as GPUs foram originalmente projetadas para acelerar a renderização de gráficos de computador, especialmente em jogos 3D. Embora continuem a ser utilizadas para essas cargas de trabalho, as GPUs se tornaram processadores vetoriais de uso geral para uso em uma variedade de configurações. Sua capacidade intrínseca de executar diversas tarefas simultaneamente proporciona uma taxa de transferência de computação muito maior do que as CPUs tradicionais e permite que sejam otimizadas para processamento de dados em vez de, digamos, armazenamento em cache de dados. As GPUs reduzem assim o custo e o consumo de energia dos farms de computação associados: sem elas, seriam necessários cerca de oito vezes mais servidores do mesmo tipo e outros recursos para lidar com o processamento online ALICE TPC de dados de colisão de PbPb a uma taxa de interação de 50 kHz.

Desde 2010, quando o farm de computadores online de gatilho de alto nível (HLT) entrou em operação, o detector ALICE foi pioneiro no uso de GPUs para compactação e processamento de dados em física de alta energia. O HLT tinha acesso direto ao hardware de leitura do detector e foi crucial para compactar os dados obtidos em colisões de íons pesados. Além disso, a estrutura do software HLT era suficientemente avançada para realizar a reconstrução de dados online. A experiência adquirida durante a sua operação no LHC Run 1 e 2 foi essencial para o projeto e desenvolvimento dos atuais sistemas de software e hardware da O2.

Para leitura e processamento de dados durante a Execução 3, os componentes eletrônicos front-end do detector ALICE são conectados por meio de links transceptores gigabit tolerantes à radiação a matrizes de portas programáveis ​​em campo personalizadas (consulte a figura “Fluxo de dados”). Este último, hospedado nos nós do farm do processador de primeiro nível (FLP), realiza leitura contínua e supressão de zero (remoção de dados sem sinal físico). No caso do ALICE TPC, a supressão de zero reduz a taxa de dados de proibitivos 3,3 TB/s no front-end para 900 GB/s para operações PbPb com polarização mínima de 50 kHz. Esse fluxo de dados é então enviado pelo farm de leitura FLP para os nós de processamento de eventos (EPN) usando software de distribuição de dados em execução em ambos os farms.

 0.1 GeV/c. Here the fake-track rate is rather negligible, however the clone rate increases significantly for low-pT primary tracks due to incomplete track merging of very low-momentum particles that curl in the ALICE solenoidal field and leave and enter the TPC multiple times./p>
COMPARTILHAR