Tsunami de bytes
- Roberto Barberá
- 25 de dez. de 2018
- 4 min de leitura

O que é 1 yobibyte. Seria coisa dos Jedi, ou do lado negro da força?
Pois não é nada disso. O crescimento da geração de dados na internet, ensejou preocupação na comunidade científica em 1998, quando já se prenunciava a necessidade da criação de medidas mais precisas, para expressão da capacidade dos dispositivos de armazenamento de dados.
O prefixo yobi foi criado, junto com vários outros, como parte do sistema de medição da capacidade binária de armazenamento. O nome “binário” tem origem no fato de ser baseado em potências de dois. Um yobibyte é igual a 280, ou 1.208.925.819.614.629.174.706.176 bytes. Isto mesmo, da ordem de um setilhão de bytes.
A International Electrotechnical Commission (IEC) surgiu com os prefixos baseados no sistema binário - kibi, mebi, gebi, tebi, pebi e exbi - em 1998. Acrescentou os prefixos zebi e yobi em 2005.
Antes da criação dos prefixos binários, a capacidade de armazenamento era medida usando os prefixos métricos do Sistema Internacional de unidades de medidas (SI). Os prefixos do SI, que incluem quilo, mega, giga, tera, peta, exa, zetta e yotta, também são chamados de prefixos decimais (ou baseados no sistema decimal). Estes prefixos (SI) foram sendo adotados para se referirem, tanto aos múltiplos em potências de 10, do sistema decimal, quanto aos múltiplos de potência de dois, usados no sistema binário.
Por esta razão, o contexto de uso tinha que ser identificado, para determinar qual sistema estava sendo referido, por exemplo, quando um termo como yottabyte (YB) era mencionado. Este termo poderia se referir a 1024 (ou 1.000.000.000.000.000.000.000.000) de bytes, ou ao número de bytes do sistema binário, que seria 280 (ou 1.208.925.819.614.629.174.706.176) bytes. Como, há alguns anos, a capacidade de armazenamento de dados era significativamente menor do que é hoje, fazia sentido usarmos os mesmos prefixos para referência aos dois sistemas, pois a diferença não era comercialmente significativa.
Imagine o volume de 1 terabyte. Se usarmos o sistema decimal teríamos 1.000.000.000.000 de bytes. Alternativamente, este mesmo terabyte de dados, usando o sistema binário, equivale a 1.099.511.627.776 bytes. A diferença de quase 100 bilhões de bytes, ou 10%, é significativa e não pode ser ignorada, pois os orçamentos de TI começam a ser impactados. Em níveis ainda mais altos de capacidade – lá pelos yottabytes - a discrepância torna-se ainda maior.
Há discussões judiciais circulando pelas cortes americanas, justamente pelo fato de que os fabricantes de discos rígidos (HDD) usaram o sistema decimal, para expressar a capacidade de armazenamento de seus produtos, enquanto os fornecedores de sistemas operacionais (SO) utilizaram mediram a capacidade de memória RAM e armazenamento de dados, expressas pelo sistema binário. Mas ambos os fornecedores usaram os mesmos prefixos.
Nos volumes de dados atuais, esta discrepância confunde, inclusive, clientes de computação pessoal, que compram um novo disco rígido, rotulado com 1 Terabyte (TB) de capacidade, mas quando chegam em casa e o instalam em seu computador, o sistema operacional reporta, por exemplo, apenas 931 Gigabytes (GB), por que o SO usa o sistema binário, para quantificar a capacidade de armazenamento (ou de memória) em bytes.
O desenvolvimento dos prefixos do sistema binário, pelo IEC, visava eliminar esta confusão. No exemplo citado anteriormente, o fornecedor do SO teria usado o prefixo binário, ao invés do prefixo decimal, reportando 931,3 gibibytes (GiB), ao invés de 931,3 gigabytes (GB) de capacidade. Ao usar os novos prefixos, o SO permitiria que os consumidores soubessem que estaria sendo usado um sistema de medição, diferente daquele utilizado pelo fabricante do HDD.
O IEC tinha boas intenções com os novos prefixos. No entanto, eles ainda não estão sendo amplamente utilizados e, como resultado, não solucionaram o problema das divergências de medição de capacidade.
Ocorre que acadêmicos, escritores técnicos, cientistas de dados e desenvolvedores de soluções comerciais modernas, cada vez mais se utilizam de sistemas abertos, que adotam os prefixos binários. Com o crescimento exponencial do uso de aplicativos e de sistemas de monitoramento, em sua maioria assistidos por inteligência artificial, espera-se uma crescente presença destas unidades de medida, em produtos comerciais.
E quão grande é um yobibyte?
Um yobibyte é a maior unidade de medida presente na escala de medição binária. São as seguintes, as unidades de medida de capacidade, no sistema binário:

Nem o EIC, nem o SI, nomearam uma unidade de medida maior do que o yobibyte, ou o yottabyte (sistema decimal). O prefixo bronto foi sugerido como a próxima unidade possível, em seguida ao yottabyte, representando 1027. Analogamente o prefixo geop tem sido sugerido para representar 1030, mas ainda não foram anunciados oficialmente. Nenhum prefixo equivalente, no sistema binário, foi sugerido.
E por que ainda usamos bytes?
O byte de armazenamento e/ou de tráfego (cada byte é um caractere), são a base da precificação dos diversos serviços de TI.
E o que os yobibyte podem medir?
Estamos em dezembro de 2018 e não há nada, do que estejamos usando, que possa ser medido em yobibytes. Entretanto, os volumes de dados continuam a explodir e, por isto, esta situação é apenas questão de tempo. Logo os yottabytes e yobibytes se tornarão mais comuns. Segundo a IDC, a esfera de dados global crescerá para 163 zettabytes, até 2025. Outras estimativas e projeções para o número de futuros de objetos conectados à Internet diferem, mas se continuarem crescendo na taxa atual, certamente chegarão a quantidades ainda mais maciças de dados. Em 2020, a Cisco (Cisco Systems) estimou que haverá 50 bilhões de dispositivos conectados à internet, ocasião em que os brontobytes terão que entrar em cena.
Mas, por enquanto, até mesmo o armazenamento em escala yottabyte, seria grande demais, para quantificarmos o mundo atual da mídia de armazenamento. De acordo com o livro The Word Spy, de Paul McFedries, seriam necessários mais de 85 trilhões de anos, para baixarmos um arquivo de 1 yottabyte de tamanho, usando nossos melhores links remotos atuais.
Apenas para ilustrar, todo o conteúdo da Biblioteca do Congresso Americano consumiria “apenas” cerca de 15 terabytes.
Abraços a todos e boas festas.
Comments