Pesquisadores do Massachusetts Institute of Technology apresentaram Sandook, um novo sistema de gestão de armazenamento destinado a data centers com pools de SSDs. Ele enfrenta três fontes de variabilidade que costumam atrapalhar o rendimento: desgaste natural dos dispositivos, diferenças entre fabricantes e conflitos entre operações de leitura e escrita.
A arquitetura é dividida em dois níveis: um controlador central que observa o sistema como um todo e controladores locais em cada nó, que ajustam operações em tempo real. Essa abordagem permite redirecionar tarefas para evitar gargalos identificados e para reduzir impactos de garbage collection imprevisível.
Na prática, o Sandook consegue, por exemplo, alternar automaticamente quais SSDs realizam leituras e gravações, além de manter perfis de desempenho para cada unidade. Dessa forma, o sistema reduz conflitos entre dispositivos e otimiza a utilização da capacidade.
Resultados de testes com um conjunto de 10 SSDs mostraram ganhos entre 12% e 94% no desempenho de aplicações reais, como treinamento de IA e compressão de imagens, além de um aumento de 23% no aproveitamento da capacidade total. As máquinas alcançaram próximo de 95% do desempenho teórico máximo, sem necessidade de hardware adicional.
Segundo Gohar Chaudhry, autora principal do estudo, essas melhorias podem reduzir a necessidade de expandir a infraestrutura e diminuem o consumo de energia, com impactos econômicos e ambientais relevantes. O estudo será apresentado no NSDI, nos Estados Unidos, com financiamento da National Science Foundation e da DARPA. A equipe planeja evoluir o sistema para incorporar novos protocolos de SSD e investigar padrões de cargas de trabalho de IA.