Grid Computing

A próxima geração de processamento

Atualmente, algumas funções de processamento são limitadas pelas restrições de seu computador pessoal ou mesmo dos servidores e mainframes de sua empresa. Entretanto, imagine um cenário onde seria possível solicitar a solução de qualquer problema e que se isso exigisse processamento extra e a medida da necessidade outros computadores seriam invocados para prover a capacidade computacional adicional. Isso sem que o usuário precise conhecer a complexidade da infraestrutura por detrás desse processamento. E no final do mês, esse usuário receberia a conta do processamento extra requerido.

Apesar de parecer ficção cientifica várias empresas, como IBM, Hewlett-Packard e Sun Microsystems (agora Oracle) acreditam e investem nesse futuro. Este conceito de processamento distribuído é conhecido como Grid Computing. Esse tipo processamento envolve milhares ou milhões de pequenos computadores interconectados através de redes locais ou redes de longas distâncias, como a Internet.

As aplicações em um Grid computer são executadas em um gigantesco computador virtual, com uma forte integração de servidores, discos e outros recursos capazes de compartilhar recursos de forma rápida e de fácil gerenciamento.

Uma experiência de integração de processamento distribuído é o projeto SETI@home (http://setiathome.ssl.berkeley.edu), uma continuação do projeto da NASA de busca de inteligência extraterrestre. Usando um software que pode ser baixado da Internet, um microcomputador pode analisar sinais do rádio telescópio de Arecibo. Atualmente, existem 1,6 milhões de assinantes em 224 países, criando um computador virtual com uma média de 10 trilhões de operações por segundo. Existem outros projetos mais sofisticados sendo financiados por governos, tais como o Reino Unido e Holanda. A IBM está desenvolvendo um projeto de US$53 milhões para um Grid computer com capacidade de 13,6 trilhões de operações por segundo, chamado Distributed Terascale Facility (DTF). O projeto está sendo financiado por centros de pesquisas e Universidades.

Para operar um Grid computer são necessários muitos protocolos, padrões e ferramentas de software. Para desenvolver padrões comuns de processamento a Universidade do Sul da Califórnia, o Laboratório Nacional de Argonne e a Universidade de Chicago através do Projeto Globus (http://www.globus.org/) estão desenvolvendo um conjunto de especificações técnicas e ferramentas de software para Grid Computing. Padrões de processamento são importantes para garantir a compatibilidade entre os computadores. Padrões emergentes como o Universal Description Discovery and Integration (UDDI) são importantes para esse esforço, bem como as linguagens de análise de dados não estruturadas para Web pages, HTLM, vídeo e arquivos de áudio MP3.

O modelo de cobrança dos recursos utilizados é um fator importante para o crescimento e aceitação do Grid Computing. A evolução e flexibilidade dos modelos de cobrança podem economizar bilhões de dólares de grandes organizações, sem contar outros benefícios do Grid Computing.

Além do software e gerenciamento, a infraestrutura de rede e fundamental para o Grid Computing. Uma rede de alta-velocidade é o que determinará a performance do sistema como um todo. Um Grid computer poderá consistir de milhares ou milhões de computadores, cada um com a capacidade de processa bilhões de instruções por segundo. Uma pequena rede poderá requer terabytes ou pentabytes de banda de transmissão e ainda poderá requerer muito mais banda. Altas taxas de transmissão são possíveis de se conseguir com um link de alta-velocidade ou com vários links de baixa velocidade. As atuais técnicas de multiplexação TDM compartilham vários canais em um mesmo meio físico; entretanto, essa tecnologia não é facilmente escalável e não atende aos requisitos de um Grid computer. Por outro lado, os computadores que formam um grid estão espalhados em distâncias não atendidas, tecnicamente, por cabos metálicos. A fibra ótica aparece como uma alternativa eficiente para atender a conexão entre os computadores. Os grid computers requerem taxas de transmissão entre 1 e 10 gigabits por segundo, o que é atingindo pela tecnologia de multiplexação por cores de luzes (WDM).

O WDM (Wavelength Division Multiplexing) usa múltiplos lasers e transmite vários comprimentos de onda de luz (lamdas), simultaneamente, através de uma fibra ótica (figura 1). Cada sinal trafega dentro de uma única cor de banda, que modula os dados (texto, voz, vídeo, etc.). O WDM utiliza a atual infraestrutura de fibra ótica das empresas de telecomunicações aumentando dramaticamente a capacidade de transmissão de dados.

GRID001

Figura 1. WDM – Multiplexação por comprimento de ondas de luz

Mais canais de dados podem ser adicionados na fibra ótica aumentando o número de canais e, consequentemente, a vazão de dados através da fibra ótica. Dentro dessa abordagem, os sistemas WDM são chamados de DWDM (dense). Sucessivas gerações de DWDM têm aumentado, significativamente, o número de canais de dados multiplexados numa única fibra ótica. A União Internacional de Telecomunicações (UTI) definiu o espaço mínimo de 0,8 nm (100 GHz) acomodando 32 canais por fibra ótica. No futuro, os sistemas devem compartilhar centenas ou milhares de canais em uma fibra ótica. Através de amplificadores óticos as redes DWDM podem ser estendidas a distâncias requeridas pelos Grid computers.

As próximas gerações de DWDM devem implementar mais que um número maior de canais de dados. Eles devem implementar a facilidade de full meshed e conexões redundantes entre os computadores que formam o Grid. O conceito de full meshed é a propriedade da rede de conectar todos os nós da rede. As redes convencionais que utilizam ATM sobre redes SDH/SONET acomodam camadas IP e outros tipos de tráfego. A característica de tráfego do grip não se adapta aos mecanismos das redes atuais que utilizam alocação de banda fixa, devendo ser desenvolvidos novos serviços para o DWDM para alocar banda sob demanda. Isso deve oferecer vantagens de alta escalabilidade, baixo custo, protocolos independentes e, talvez criar uma rede para grids totalmente ótica. Veja a figura 2.

Existe um esforço para criar uma rede chamada “optical IP” onde os usuários poderiam solicitar, dinamicamente, porções adicionais de banda por um tempo determinado ou por serviço. Isso implica no uso do IP diretamente no DWDM, eliminando o IP over ATM over SDH/SONET over DWDM. Um dos esforços de padronização é o Optical Domain Service Interconnect (ODSI), http://www.odsi-coalition.com, uma coalizão de empresas que buscam a definição de interfaces comuns entre a camada física, utilizando meios óticos ou elétricos, com a subcamada de acesso ao meio IP do modelo OSI (Open System Interconnection). Esse trabalho suporta os esforços da Internet Engineering Task Force (IETF) para que o Multi-Protocol Label Switching (MPLS) tenha interface direta com o meio físico. O ODSI propõe um padrão para ser utilizado abaixo da camada 3 do OSI para equipamentos de transmissão ótica e roteadores e switches IP. Um esforço paralelo e complementar, também baseado em MPLS, está sendo conduzido pelo IETF. Conhecido como Multi-Protocol Lambda Switching (MPLmS, “lambda” – referencia ao modelo nativo de comprimento de onda), este esforço propõe métodos para conectar o link ótico e os roteadores de alta-velocidade usando os métodos de roteamento da camada 3. Operando numa camada mais alta do que o proposto pelo ODSI tem a vantagem de não requer um novo protocolo para QoS (Quality-of-Service) e controle de banda.

Atualmente, o DWDM com 32 canais opera comercialmente em picos entre 1 e 2 gigabits por segundo, porém em pouco tempo poderá exceder 10 gigabits por segundos. Isso permitira a alocação de banda por demanda no backbone do grid computer, que poderá ser baseado em uma tecnologia totalmente ótica com roteamento usando MPLS.

GRID002

Figura 2 – TDM x DWDM

Muitos obstáculos deverão ser ultrapassados para que um poderoso grid computer se torne uma realidade. Porém, a tecnologia está se adaptando aos novos modelos de negócios. O grid computing é um exemplo de negócio que permite transparência para o compartilhamento de recursos, dados e aplicações que poderá permitir as empresas economizarem bilhões de dólares. Se os esforços que estão em movimento surtirem efeito, em poucos anos teremos o grid computing uma realidade.