Introdução
A infraestrutura óptica nacional operada pela RNP vem sendo renovada, de forma a permitir que a capacidade do backbone possa ser facilmente escalável para múltiplas conexões de 100 Gb/s. Isso permitiu que fosse aprovada a construção da Rede de eCiência da RNP para conectar os principais centros brasileiros de pesquisa que possuem requisitos avançados de processamento, análise, transmissão e armazenamento de grandes volumes de dados. Esses centros precisam ser atendidos com políticas e serviços diferenciados, diversamente daqueles que hoje são oferecidos para as instituições que atuam na cauda longa da ciência.
Em uma rede de e-Ciência onde há um grande volume de dados sendo trafegados em velocidades como 100 e 200 Gbps, se faz necessário um ajuste cuidadoso de hardware e software para evitar problemas de desempenho. Abaixo, detalhamos as otimizações e alterações necessárias para que se tenha um ambiente de transmissão de dados estável e com velocidades próximas às desejadas.
DTN
Um DTN (Data Transfer Node) é um servidor especializado, otimizado para transferências de dados disco-a-disco em alta velocidade. Ele é projetado especificamente para mover grandes volumes de dados através de redes WAN de alta performance (ex.: 100/200 Gbps), onde latência e perdas de pacotes podem afetar a transferência de forma significativa.
Características principais de um DTN:
- Hardware robusto com CPUs de alto desempenho, grande quantidade de memória RAM;
- Sistemas de armazenamento local rápido baseados em SSDs em RAID;
- Interfaces de rede de alta velocidade (100/200/400 Gbps);
- Software e sistema operacional otimizados para transferência de dados.
Um DTN serve como ponto intermediário em uma rede, facilitando a transferência eficiente de dados entre diferentes locais ou instituições. Ele é especialmente importante em redes acadêmicas e de pesquisa, onde grandes conjuntos de dados precisam ser transferidos de forma rápida e confiável.
Um ponto importante de um DTN é que ele deve ser projetado levando-se em conta arquitetura interna da máquina: placas de rede e discos em barramentos PCIe compartilhados ou em processadores diferentes podem ocasionar gargalos internos dentro da máquina, limitando a transferência.
Também é importante levar em conta a topologia da rede onde ele é inserido. Por exemplo, se ele possuir uma interface de saída maior que o enlace da rede da instituição, ele pode sobrecarregar roteadores e switches no caminho, gerando estouro de buffers de equipamentos de rede, perda de pacotes e um desempenho por vezes pior do que se tivesse uma interface de menor velocidade no DTN. Desta maneira, normalmente o DTN é instalado como parte de uma arquitetura de rede denominada DMZ Científica (Science DMZ). Leia mais sobre o modelo Science DMZ aqui.
Seleção de Hardware
Arquitetura interna de um DTN
Os Data Transfer Nodes (DTNs) são servidores especializados projetados para otimizar a movimentação eficiente de grandes volumes de dados entre sistemas. Sua arquitetura combina hardware de alto desempenho com software ajustado para maximizar o throughput de transferência, geralmente com sistemas operacionais configurados para eliminar gargalos. Esses servidores são amplamente utilizados em redes de alto desempenho, como aquelas que integram iniciativas científicas e institucionais.
Em termos de armazenamento, no contexto de e-ciência é comum existir uma variabilidade na maneira como armazenar e distribuir esses dados internamente na intituição. Sendo elas, principalmente:
- Armazenamento Interno, no próprio DTN.
- Utilização de sistemas de armazenamento especializado: Lustre, Ceph, BeeGFS e entre outros.
- Uso de NFSv4 (Network File System) otimizado.
Uma discussão mais detalhada sobre alguns desses métodos podem ser encontrados na página: Armazenamento
Testes realizados em DTNs, especialmente com transferências memória-a-memória, destacam a importância de ajustes finos como o gerenciamento de buffers TCP, otimizações na afinidade de IRQs da NIC com núcleos do processador e ajustes nos perfis de consumo de energia. Essas melhorias permitem alcançar velocidades próximas de 100 Gbps em ambientes controlados.
Software
No contexto de alto desempenho em redes, uma variedade de softwares é utilizada, tanto para testes de desempenho de redes quanto para lidar diretamente com a transferência de dados. Ferramentas como Iperf3, Ethr e PerfSONAR são amplamente reconhecidas por sua eficácia na avaliação de aspectos relacionados a redes. Esses softwares possibilitam, por exemplo, a realização de testes memória-a-memória, que permitem analisar se as otimizações implementadas em um DTN (Data Transfer Node) estão entregando o desempenho teórico esperado com base na infraestrutura projetada.
Uma vez que o ambiente esteja otimizado para transferências de dados, ferramentas como MDTMFTP, Atempo Miria, Globus Online, entre outras, desempenham um papel fundamental. Esses softwares são projetados para movimentação de dados em alto desempenho e oferecem funcionalidades adicionais, como o gerenciamento de usuários, permissões e endpoints, sendo especialmente úteis no caso de ferramentas como Globus e Atempo. Essas opções ajudam a garantir a transferência eficiente de dados reais em um ambiente controlado e seguro.
A junção desses dois tipos de softwares, resultado de estudos aprofundados em arquitetura de hardware, otimizações no sistema operacional e técnicas de paralelismo, cria um ambiente propício para o tráfego de dados científicos em alto desempenho. Essa abordagem garante que as infraestruturas projetadas atendam às necessidades de projetos que demandam alta capacidade e confiabilidade no transporte de grandes volumes de dados.
Science DMZ
O modelo Science DMZ foi concebido para atender às demandas de compartilhamento eficiente de dados científicos em larga escala, conectando instituições acadêmicas, redes de pesquisa e redes educacionais. Ele promove um ambiente otimizado para colaboração científica ao contornar desafios e demandas que geralmente estão presentes em redes tradicionais.
Redes tradicionais são caracterizadas por focarem em mecanismos de segurança dos quais isolam e filtram os dados que estão trafegando a fim de ter uma maior garantia de confidencialidade e integridade. Como resultado desse processamento a mais, há um impacto relevante no desempenho quando o assunto são altas taxas de throughput. O modelo Science DMZ, então, adota uma arquitetura especializada, isolando segmentos específicos da rede institucional. Esse isolamento permite o tráfego de grandes volumes de dados com alta eficiência, sem comprometer o desempenho necessário para aplicações científicas e ainda garantindo segurança por meio da autenticação dos parceiros de pesquisa e do monitoramento do tráfego para detectar anomalias.
O núcleo dessa arquitetura é formado pelos DTNs mencionados acima — servidores dedicados à transferência de dados de alto desempenho. Somados, esses componentes garantem que o Science DMZ ofereça uma infraestrutura robusta para o transporte de dados científicos em alta velocidade, atendendo às necessidades de projetos colaborativos de grande escala.