Web Semântica - O que é notícia em Sergipe

Médicos que atendam pelo meu convênio de saúde, que tenham vaga na quinta ou na sexta pela tarde e que estejam a no máximo 2 km de distância da minha casa. Pacotes turísticos, no feriadão de Corpus Christi, de cidades de Nordeste, que aceitem pagamento no cartão em até 6 vezes e que tenha previsão de tempo bom. Já pensou você poder fazer essas pesquisas no Google e ele realmente retornar resultados esperados? Estamos caminhando para isso, com a chamada Web Semântica

Caso tenha curiosidade de colocar as duas pesquisas no Google, você poderá ver que teremos algumas dezenas de resultados, mas não são resultados relevantes. Como poderemos dar significado a informação publicada na web? A linguagem de criação de páginas mais utilizada atualmente (HTML) não permite descrever a informação, o HTML serve apenas para dar a aparência para a página. Imagine que uma determinada página web tenha a seguinte frase: “Os namorados estiveram presentes no dia 10”, caso tenha uma pesquisa por “Presentes para o dia dos namorados com 10% de desconto”, a página com a primeira frase estará presente na pesquisa. Isto acontece pois “presente” é uma palavra ambígua, “dia dos namorados” é um evento (não pode ver as palavras isoladamente) e estamos procurando por descontos de 10%, ao invés do número 10.

Os buscadores atuais não conseguem dar significado ao conteúdo publicado na Internet, eles procuram apenas por palavras dentro da página, ou seja, é uma “pesquisa burra”. A parte inteligente (o ser humano) é quem filtra os resultados, verificando se eles realmente satisfazem os critérios de pesquisa. O objetivo da web semântica é desenvolver mecanismos que permitam que os computadores entendam o significado da informação tão bem quanto os seres humanos.

Como podemos fazer para deixar as páginas machine-readable (que possa ser lida por máquinas)? Temos duas linguagens para deixar o conhecimento estruturado, o XML e o RDF. Com o XML é possível estruturar os dados criando tags personalizadas. O RDF define triplas (um recurso, uma propriedade e um valor), onde cada um desses define um par de valores. Imagine um site de músicas que possui uma infinidade delas. Em RDF poderíamos definir cada página assim: Recurso – http://www.site.com.br/nomemusica; Propriedade – música; valor – Nome da música. Dessa forma, os dados ficam mais estruturados e consequentemente mais fáceis de ler por computadores. Bem, a idéia desta coluna não é se aprofundar na web semântica, quem quiser mais detalhes pode pesquisar no Google que terá resultados relevantes!

A web semântica é um projeto bem embrionário, ele ainda deverá evoluir bastante para que possa realmente satisfazer as nossas necessidades de pesquisa de informação, mas temos que ficar atentos para as mudanças que ele deverá acarretar para toda a web. As perguntas do primeiro parágrafo estão longe de retornar resultados satisfatórios, porém um dia os teremos, espero poder vê-los.

Até a próxima semana.

em tempo: Na semana passada recebi alguns e-mails sobre software livre. Primeiro é que o software livre não significa que o software é de graça, veja aqui as diferenças entre software livre e software free. Segundo, existem sim situações em que a adoção do software livre não vale a pena. Isto acontece principalmente quando falamos de aplicações customizadas e não de aplicativos prontos, ou seja, trocar um pacote Office é simples, mas trocar uma aplicação em .NET por uma em Java não é tão fácil assim.

O texto acima se trata da opinião do autor e não representa o pensamento do Portal Infonet.