do Portal Ah Duvido

Quando você faz buscas pela internet, geralmente utiliza o Google para obter resultados. Como consequência, muitos afirmam que, se não está no Google, não existe na internet. O mesmo vale para outros buscadores, como os não tão conhecidos e utilizados Bing e Ask.fm.

Porém, os dados que percorrem a rede mundial de computadores vão além do que é mostrado nessas ferramentas conhecidas como “Crawlers” (motores de busca). Muito do que não aparece nos resultados de busca, desde arquivos científicos, livros raros ou até mesmo novos vírus estão presente na “Deep Web” (Web Profunda).

No mundo online, existe um grande receio de que a Deep Web seja um espaço arriscado, com conteúdos ilegais e que atentam contra os direitos humanos. Para explicar como funciona esse “lado B” da web, o Portal EBC ouviu ciberativistas e membros de associações que lutam pelo uso seguro da internet. Eles desmitificam o ambiente, mas não deixam de alertar para os usos indevidos que ocorrem nas profundezas da internet.

A internet é formada por computadores com conteúdos conectados entre si por meio de uma rede de cabos espalhados pelo mundo. Por essa rede, pode-se chegar a qualquer máquina desde que se conheça o endereço da outra máquina. Na web, esse endereço é um protocolo chamado TCP/IP. O IP dá um número único a um computador (ou roteador) como se fosse um CEP.

Mas afinal, o que é a Deep Web?

Mas, em vez de decorar números, optou-se pelo uso de servidores de nomes (servidores de DNS), máquinas que possuem uma lista com as correspondências entre o IP e um endereço nominal. Por exemplo, o site da Receita Federal está hospedado em uma máquina com o IP 161.148.25.177, mas quem quer encontrá-la não precisa digitar os números e sim o endereço www.receita.fazenda.gov.br, que aponta para o IP 161.148.25.177.

Assim, os buscadores web acessam esses servidores de nome e rastreiam (detalhadamente) todos os conteúdos com permissão para serem acessados. Em síntese, a Deep Web seria, então, tudo aquilo que está disponível em máquinas e que não estão identificadas com um DNS, nem pelos motores de busca. Ao mesmo tempo, é comum ouvir que o que pode ser acessado facilmente está na superficie da internet.

Rodrigo Troian, integrante da Associação Software Livre Brasil, desmente a ideia da Deep Web ser uma segunda rede. Troian explica que o conteúdo da Deep Web está ligado diretamente na Internet, mas que somente são acessados se a pessoa souber o endereço da máquina. “A Deep Web não é nada mais que um gueto. Para você entrar, tem que fazer parte, tem que ter características específicas”, compara.

Uma pesquisa de 2000 da empresa internacional BrightPlanet, especializada no assunto, apontou que 95% dos dados disponíveis nesse lado oculto da Web são páginas públicas, normalmente oriundas de órgãos públicos, universidades e empresas – que guardam na rede documentos públicos, artigos científicos etc.

Navegação anônima

Uma das formas mais comuns de se navegar em parte da Deep Web é a feita pelo navegador Tor, que dificulta a embaralha a identificação dos computadores ao acessarem determinado conteúdo. O site foi criado pela Marinha dos Estados Unidos em 1996 e é mantido, atualmente, por voluntários pelo mundo.

Rodrigo Troian explica que o Tor dificulta o rastreamento, pois utiliza várias máquinas que ficam no meio do caminho. “Se eu quero ir de A para B, eu passo primeiro de A para D, de D para Z, etc”. O ativista alerta, entretanto, que os dados e a identidade da máquina de quem acessa não são invioláveis. “As pessoas confundem muito o Tor com navegação anônima. Ele tem o objetivo de dificultar a identificação do IP de onde você está. Em tese seria anônima, mas a navegação não é criptografada e pode ser rastreada na volta”, destaca.

Riscos da Deep Web

Por não ser encontrada em buscadores, a Deep Web traz diferentes conteúdos como livros raros, artigos científicos  e fóruns de discussões específicas. Mas também pode ter computadores com propagandas para venda ilegal de drogas, textos preconceituosos e crimes diversos.

“A Deep Web era um incógnita até o ano passado. Mas esse ano caiu na boca do povo com tutoriais, fóruns e reportagens sobre o tema”, conta Thiago Tavares, presidente da SaferNet Brasil, organização sem fins lucrativos que atua pelo uso seguro da internet.

A ONG realiza ações de conscientização e atendimento psicológico para combater a crimes de pedofilia e de ódio racial que acontecem na rede, o que se torna mais difícil de identificar quando não pode ser pesquisada. De acordo com Thiago Tavares, a SaferNet já recebeu denúncias e identificou links de crimes na Deep Web. A organização possui uma parceria com a Polícia Federal e 17 ministérios públicos, para quem encaminha todas as denúncias.

Contudo, Tavares ressalta que é preciso entender melhor a Deep Web. “Ela foi criada, inclusive, para a defesa dos direitos humanos. Mas, como qualquer ferramenta, pode ser usada para o bem ou para o mal”. Sobre os possíveis uso do espaço, ele aponta que ela é “usada também por jornalistas investigativos, militantes de direitos humanos, pessoas que precisam se comunicar sem o risco de serem monitoradas”, aponta.

Tavares cita, por exemplo,o caso do WikiLeaks, que divulgou vários conteúdos secretos do governo-americano e que começou na Deep Web. “Todo o ativistmo digital utiliza conexões seguras”.

Já Troian, integrante da Associação Software Livre, lembra o ditado “a diferença entre o remédio e o veneno é a dose” ao citar os riscos da Deep Web. Ele destaca que existem várias pessoas fazendo a manutenção de máquinas e alimentando o conteúdo para fins diversos e que tanto a Polícia Federal quanto o FBI ou outras polícias do mundo estão infiltradas “analisando o que está sendo publicado”.

Mesmo com as diferenças, o presidente da Safernet alerta que a Deep Web não é um lugar interessante para adolescentes e crianças. “A dica que dou é se o seu filho anda por lá, você precisa conversar com ele porque não tem nada de interessante pra ele”, coloca. Ele explica que muitas organizações criminosas perceberam que esse ambiente era um lugar de difícil investigação por causa do anonimato e criptografia.

Além disso, Tavares afirma que, independente de ser na superficie ou nas profundidades da internet, é importante avaliar bem o que se coloca na internet. “Tudo que se coloca na rede é para sempre e o que você coloca dificilmente pode ser retirado”, conclui.

As principais dúvidas sobre a Deep Web

1. O que é a deep web?

O termo “deep web” (“web profunda”) tornou-se um termo geral para se referir a todo um conjunto de sites e servidores de internet. Explicar o termo, portanto, não é mais tão simples.

Originalmente, a “deep web” eram os sites “invisíveis” – páginas que, por qualquer motivo, não apareciam em mecanismos de busca, especialmente no Google. Eram páginas que, para serem encontradas, necessitavam do uso de diversos mecanismos de busca em conjunto, além de ferramentas adicionais e ferramentas de pesquisa individuais de cada site.

O termo se popularizou com uma definição mais compacta para se referir aos sites que necessitam do uso de programas específicos para serem acessados. O mais popular entre eles é o Tor, mas existem outros softwares, como Freenet e I2P. O emprego do termo “deep web” é incorreto neste contexto – o termo certo seria “dark web” (web escura).

Porém, como esses sites precisavam de ferramentas especiais para serem acessados, eles não apareciam em mecanismos de pesquisa e, assim, as duas definições não eram incompatíveis. No entanto, com o passar do tempo, parte desses sites de acesso exclusivo via Tor foi disponibilizada (via “pontes de acesso”) na web normal – que não necessita de software especial. Com isso, o conteúdo que antes era dessa web “inacessível” foi parar até mesmo no Google. Acessar esse conteúdo, portanto, é tão fácil quanto acessar qualquer outro site.

É muito difícil saber com certeza se o termo deep web está sendo usado para se referir a um canal de acesso via Tor ou a páginas e serviços de acesso realmente limitado e restrito, independentemente da tecnologia.

2. Qual a diferença entre deep web e dark web?

Com base nas definições mais puras, um site da “deep web” não tem seu conteúdo disponibilizado em mecanismos de pesquisa e, portanto, não pode ser encontrado, exceto caso por quem conhece o endereço do site.

A “dark web” consiste dos sites que existem primariamente em redes anônimas e que necessitam de programas especiais. O Facebook, por exemplo, tem uma versão de seu serviço na dark web. No entanto, o meio de acesso principal não é este. Mas há outros sites que existem exclusivamente nessa dark web e não podem ser acessados sem o uso de programas como Tor, I2P e Freenet.

3. Que tipo de conteúdo há na deep web?

Como a “deep web” se refere a qualquer conteúdo fora dos mecanismos de pesquisa, a definição é bastante ampla. Existe muito conteúdo legítimo disponível na web e que nem sempre pode ser encontrado com uma pesquisa em mecanismos de pesquisa geral. Um exemplo disso são decisões judiciais, que muitas vezes exigem pesquisas diretas nos tribunais onde tramitaram.

A deep web também pode consistir de sites com conteúdo pessoal, páginas cujos donos decidiram não incluir em mecanismos de pesquisa por qualquer motivo, páginas que nunca receberam links de outros sites (porque só foram compartilhadas por e-mail, por exemplo) e também espaços para a troca de conteúdo ilícito, como pirataria. Como esses sites muitas vezes fornecem arquivos grandes para download, não é sempre prático manter esse conteúdo na “dark web”, onde as velocidades costumam ser menores.

4. Que tipo de conteúdo há na dark web?

A dark web, por fornecer mecanismos de anonimato, é atraente para ativistas políticos, hacktivistas e criminosos virtuais, além pessoas que buscam compartilhar conteúdo que foi censurado. Com ações policiais que derrubaram sites de abuso sexual infantil da web comum, parte desse conteúdo também passou a ser disponibilizado pela dark web.

A dark web também é notória por oferecer lojas virtuais de mercadorias proibidas ou de difícil acesso, inclusive drogas (lícitas e ilícitas) e armas.

Como a dark web também serve como meio anônimo para acesso à web comum, ela pode ser usada para burlar bloqueios de rede (como os que existem na China). Em outras palavras, nem todo mundo que utiliza a tecnologia da dark web pode estar interessado nos conteúdos que estão presentes nela, mas sim no anonimato que ela fornece para o acesso a qualquer conteúdo.

5. Por que alguns sites ficam fora dos mecanismos de busca?

Os mecanismos de busca, como o Google, precisam, em primeiro lugar, encontrar um site. Isso normalmente ocorre com links. Quando uma página que o Google já conhece coloca um “link” para outra página, o Google segue esse link e passa a incluir essa página em sua busca (um processo chamado de “indexação”).

Porém, mesmo que haja um link para a página, ela pode ainda bloquear mecanismos de pesquisa. Isso pode ser feito via rede (bloqueando os endereços IP da rede dos mecanismos de pesquisa) ou utilizando mecanismos oferecidos pelos próprios sites de busca que permitem a um site indicar qual conteúdo pode ser indexado. Um site pode facilmente determinar que a indexação de suas páginas é proibida e, nesse caso, elas não aparecerão nos mecanismos de busca mais comuns, que honram essas configurações.

Alguns conteúdos exigem buscas específicas. As decisões Judiciais, por exemplo, só podem ser encontradas por alguém que sabe um número de processo ou a OAB de um advogado para pesquisar nos sites dos tribunais. Os mecanismos de pesquisa não têm essas informações e não “sabem” preencher o formulário. Por isso, esse conteúdo tende a ficar fora do alcance.

Certos conteúdos também não podem ser indexados por causa do formato em que estão armazenados. Um conteúdo pode existir na web como um arquivo de áudio ou vídeo que o mecanismo de busca não consegue transcrever para texto. Nesse caso, o conteúdo também não vai ser encontrado, a não ser que você saiba especificamente o nome do arquivo ou título do arquivo multimídia.

6. Por que a dark web necessita de programas específicos?

A internet só funciona graças a um grande acordo que existe na web: todos os sites, navegadores e sistemas operacionais “falam” um conjunto de “línguas” em comum. Esses são os “protocolos de rede”.

A dark web estabelece uma camada de protocolo nova que o computador não conhece. E, com isso, automaticamente esses sites se tornam incomunicáveis.

O objetivo dessa camada adicional é normalmente a garantia do anonimato dos usuários. Os detalhes técnicos variam em cada protocolo, mas a maioria estabelece uma série de intermediários em cada conexão. Certos participantes da rede (que podem ser todos ou só alguns) tornam-se intermediários das conexões dos demais usuários e, com isso, qualquer visita ou acesso fica em nome desses usuários e não em nome do verdadeiro internauta.

7. É possível quebrar o anonimato da dark web?

De modo geral, sim. Mas as técnicas exigem certos recursos tecnológicos avançados e, às vezes, um pouco de sorte.

Uma delas é conseguir controlar um grande número de sistemas intermediários na rede. Se o número de sistemas controlados for grande o bastante, o interessado pode conseguir fazer alguma ligação entre o usuário e o conteúdo acessado. Essa é uma operação de médio prazo, já que é preciso monitorar os acessos por um bom tempo até que as ligações possam ser feitas sem depender da sorte.

Outro meio, que vem sendo bastante empregado pelo FBI, é a instalação de programas espiões. A autoridade policial faz isso após conseguir uma autorização da justiça para tomar o controle de um serviço disponibilizado na rede anônima (a identificação deste depende de outros métodos, como o mencionado acima ou então cooperação de um delator). Uma vez podendo controlar o site, um código especial é colocado na página para tentar contaminar os usuários com vírus e relatar as informações ao FBI. Isso, no entanto, depende de vulnerabilidades no software do possível investigado, o que nem sempre pode ser fácil de explorar.

Essa técnica foi utilizada em um site com imagens de pornografia infantil, por exemplo. O FBI foi criticado por temporariamente ter mantido o site no ar em vez de retirá-lo imediatamente, mas a Justiça americana entendeu que a medida foi necessária para colher mais informações sobre os visitantes da página.