[webmail]Login:    Senha:   

Menu
 



 
Notícia: 77ªDefesa de Dissertação do Mestrado em Informática
Postado em 14/10/2008 por secretaria

77ª Defesa de Dissertação do Mestrado em Informática
A Coordenação do Programa de Pós-Graduação em Informática, convida a todos 
a participarem da 77ª Defesa de Dissertação do aluno Luiz Osvaldo Rogério Evangelista.

Data: 20/10/2008
Horário: 13:00h
Local: Sala de Reunião do Bloco M, ao lado do CPD – Mini Campus
Av. Gen. Rodrigo Octávio Jordão Ramos, 3000, Setor Sul, Bloco B, Coroado II.

Banca:   Prof. Altigran Soares da Silva (Orientador-UFAM)
             Prof. Edleno Silva de Moura (UFAM)     
             Prof. João Marcos Bastos Cavalcanti (UFAM)
             Prof. Wagner Meira Júnior (UFMG)

Título:Blocagem Adaptativa e Flexível para o Pareamento Aproximado de Registros”.
                                                     Resumo
Em tarefas de integração de dados, registros de mesma fonte de dados ou de fontes de dados diferentes são freqüentemente comparados em tentativas de identificar pares que correspondam à mesma entidade no mundo real. O custo desses processos de busca por registros duplicados cresce quadraticamente com o aumento do tamanho das fontes de dados e por isso as abordagens diretas, analisando todos os pares de registros, devem ser evitadas. Nesse contexto, técnicas de blocagem descritas na literatura corrente podem ser usadas para identificar os pares de registros com maiores chances de corresponder à mesma entidade, reduzindo o esforço na procura por registros duplicados. Essa tarefa não é trivial em razão de inconsistências dos dados e devido às grandes quantidades de registros que são normalmente encontrados nos arquivos que devem ser processados. Técnicas recentes são baseadas em processos "aprendizagem de máquina" ("machine learning") que são usados para encontrar a melhor função de blocagem, sendo essas funções definidas por combinações de regras de baixo custo de processamento que definem como os registros devem ser agrupados. Por exemplo, a regra de termos em comum pode ser usada para agrupar os registros que apresentam termos coincidentes. Este trabalho apresenta uma nova técnica de blocagem, baseada em processos de aprendizagem de máquina e também na técnica de "programação genética", que permite o uso de regras mais flexíveis e um maior número de regras para a definição de funções de blocagem, aumentando a eficiência na identificação de registros duplicados. Resultados de experimentos mostram que percentuais de acertos acima de 95% podem ser conseguidos na detecção de pares duplicados de registros, verificando dados reais e sintéticos.
 
Login
Apelido

Senha

Ainda não é Cadastrado? Você pode se cadastrar clicando aqui. Como usuúrio cadastrado você tem algumas vantagens como escolher o Tema do site (template) e enviar coment´rios com seu nome.
 

Links relacionados
· Mais sobre
· Notícias por secretaria


As notícias mais lidas sobre :
77ªDefesa de Dissertação do Mestrado em Informática

 

Classificação de notícias
Votar: 0
Votos: 0

Por favor, dedique um segundo de seu tempo para votar nesta notícia:

Excelente
Muito bom
Bom
Regular
Péssimo

 

Opções

 Imprimir Imprimir

 

Desculpe, comentários não estão disponíveis para esta notícia.


Contato:
3647-4019 / 3647-4022
secretaria@dcc.ufam.edu.br