Mais Populares

19 de janeiro de 2014

Banco de dados do Facebook

O Facebook teve em sua história um período que ninguém o acessava, e após isto, começou crescer lentamente, e hoje é um dos maiores sites do mundo, e até além mesmo do Google.

Começou em apenas um servidor dedicado, e os custos foram começando a causar muitos prejuízos, hoje eles tem só 60.000 servidores espalhados em todo o mundo entre vários data-centers. 

Escrito em PHP e inicialmente utilizando o banco de dados MySQL, atualmente para análise dos dados de acessos, o Facebook utiliza Presto (http://prestodb.io).

O que é o Presto?

Um banco de dados distribuído capaz de analisar querys através de bancos de todos os tamanhos, entre gigabytes à petabytes. 

Presto foi desenhado e escrito para acompanhar relatórios de análises interativos e compara-se com bancos de dados "Data Warehouses" comerciais.

O que é um Data Warehouse?

Data Warehouse, é um banco de dados específico que mantém uma grande quantidade de informações, geralmente log de acessos, contabilização de pequenas informações, e que fazem as informações adquiridas com estes pequenos detalhes, importantes para saber onde determinado item tem tido maior foco do que outros itens.

No caso do Facebook, é bom para analisar qual país acessa mais o site, ou qual tipo de usuário do sexo masculino de São Paulo prefere curtir ao invés de compartilhar, entre outros aspectos de analise, no fim de saber a intensão do usuário.

Recentemente o Facebook removeu a opção "Visualizar esta página como ..." no qual poderia escolher seu amigo para ver como sua página aparece para ele. Com certeza com a análise, foi visto que quase ninguém acessava tal recurso, e por isto foi desativado.

Quem usa o Presto no Facebook?

De fato, apenas os funcionários o utilizam para tirar relatórios de vários propósitos diariamente, praticamente 30 mil queries com um total de quase 1 petabyte de dados lidos nos bancos diariamente.



Mais informações você pode ver em:
http://prestodb.io/
https://www.facebook.com/notes/facebook-engineering/presto-interacting-with-petabytes-of-data-at-facebook/10151786197628920

Um vídeo do Facebook mostrando que Presto é de 10 à 100 vezes mais rápido que outras soluções de banco de dados:
https://www.facebook.com/photo.php?v=10202463462128185

Nenhum comentário :

Postar um comentário

Deixe seu comentário abaixo e curta Tutorial TI no facebook!