A computação em nuvem ea ascensão de grandes volumes de dados

A nuvem permite grande processamento de dados para empresas de todos os tamanhos, aliviando uma série de problemas, mas ainda há complexidade na extração do valor de negócio de um mar de dados.
datacentercloud.png

A computação em nuvem democratiza grandes dados – qualquer empresa pode agora trabalhar com dados não estruturados em uma escala enorme.

No primeiro glance,-lo não é óbvio por isso que os métodos de o novo mundo de dados grande de dados não estruturados são até mesmo necessário. Mesmo se novos métodos de trazer nova valor de negócio, porque não ficar on-premissa? Por que se preocupar com bancos de dados de nuvem ?

O rótulo de dados grande

De dados Big é um daqueles novas, labels brilhantes, como SDN , DevOps e cloud computing, que é tanto difícil de ignorar e difícil de entender. Não existe um único “big de dados” type –lo é um rótulo coletivo preso on dados não estruturados, a pilha de tecnologia que ela habita, e os novos processos de de negócios que estão crescendo up em torno de-lo.

Por exemplo, a disciplina de grandes analytics de dados é de cerca de recebendo o valor negócio fora de grandes conjuntos de dados. Os cientistas de dados trabalhar com recursos e processos para transformar os dados em informação útil. The RDBMS classic (Relational Sistema de Gestão da DataBase) pode lidar com um monte de de dados, e tem sido fazê-lo por décadas. Por que não pode um pedaço de pau cientista de dados com dados estruturados em uma RDBMS? Qual é o melhor – RDBMS ou NoSQL ?

Dados estruturados ou não estruturados?

A pilha técnica escolhe uma empresa é ditada pelo tipo de dados que necessitam de armazenar e o tipo de dados é ditada pelos requisitos comerciais.

O RDBMS é bom para o gerenciamento de dados estruturados, altamente relacionais e continuará a ser o software de escolha para muitos requisitos.

Para a quantidade crescente de dados não estruturados produzidos pelos meios de comunicação social, redes de sensores, análise de dados e federado e para constantemente mudando de dados que precisa ser replicado para outros sites operacionais móveis ou tecnologias trabalhadores de NoSQL melhor se encaixam os casos de uso. Dados não estruturados pode ser terabytes ou mesmo petabytes de tamanho.

No local pilha de tecnologia relacional

O RDBMS é o tipo de software de armazenamento que tem sido dominante por décadas.Todos os dados em um RDBMS é estruturado – clean, ordenada e fácil de entender. Isso faz com que seja bom para algum trabalho, mas ruim para os outros. RDBMS produtos também são bem conhecidos; uma geração de administradores de banco de dados é experiente em cuidados de RDBMS e alimentação.

One big problema com uma RDBMS é quando que ele chegue muito ocupado. Quando a quantidade de de dados começa a enchimento up o disco de, e as consultas são se debatendo o CPU e o resultado define sufocam a RAM, mais recursos são obrigados a manter o funcionamento DBMS. Há é apenas uma maneira de escala, e isso é o “para cima.” Scaling para fora não funciona porque um serviço de de banco de dados relacional só tem um porta da frente. E a única maneira para dimensionar up é a de comprar uma caixa de maior.

Intensificação não cura problemas de RDBMS. Mesmo o maior computador, com a sua enorme TI preço orçamento devorando, só resolve o problema de recursos. O departamento de TI ainda tem para resolver outros problemas como HA fail-over, recuperação de desastres e armazenamento de dados onde é necessário.

Se o infra-estrutura é on-premissa, existem problemas tradicionais a serem superados.Gerenciando on-premissa RDBMS está consumindo caro e demorado. An on-premissa MySQL, o Oracle ou SQLServer serviço de de banco de dados está propped up por um departamento de TI sobrecarregado com uma fila de do trabalho e da inflexível hardware. Se uma empresa aluga Azure da Microsoft Banco de Dados , Google Cloud SQL ou Amazon RDS essas dores de cabeça de infra-estrutura ir de distância.

Uma grande nuvem de dados: novas soluções, novas dores de cabeça

Em teoria, gerenciando grandes dados baseados em em nuvem é cost-effective, escalável, e rápido para construir. Infelizmente, nem tudo é boa notícia.

Os administradores de DB não têm um passeio fácil. Os bancos de dados NoSQL que têm aparecido em os últimos anos, com os seus pares chave-valor, lojas de de documentos, e schemas em falta, não olhe como os bancos de dados relacionais eles estão substituindo lentamente. Além disso, os novos rios de de dados são difíceis para capturar, store, processo, relatório on, e archive.

Não é tão ruim para os administradores de sistema. Se eles executar um nuvem privada, o novo pilha de tecnologia de dados não estruturados de hardware e software se parece com o pilha de dados estruturado old – IaaS na parte inferior, um serviço de de banco de dados no meio, e aplicações on top entregando o valor de negócio. Se eles conseguirem serviços de nuvem pública, eles não tem que tocar as camadas inferiores da pilha de tecnologia.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: