Serie De Ficção Cientifica Brasileira: A nossa vida é repleta de magia quando entendemos, e unimos a nossa sincronicidade com o todo. “A Harpa Sagrada” inicia-se numa serie de revelações onde o homem tem sua essência cravada no sagrado, e o olhar no cosmos aspirando sua perfeição.

quarta-feira, 13 de fevereiro de 2013

"Time Machine" automatizado vai reconstruir línguas antigas




Um dos mais antigos problemas em lingüística está reconstruindo as palavras que apareceram nos protolanguages ​​de que nossas línguas modernas evoluíram.
Por muito tempo, era muito difícil para os cientistas para reconstruir centenas de línguas ancestrais.
Agora, cientistas da Universidade da Califórnia, em Berkeley, criaram uma "máquina do tempo", automatizado das sortes, que irá acelerar e melhorar este processo.
Línguas antigas segurar um tesouro de informações sobre a cultura, política e comércio do passado de milênios. No entanto, reconstruindo-los a revelar pistas na história humana pode exigir décadas de trabalho árduo.


Clique na imagem para ampliarIndo Família Europeu de Línguas. Créditos: http://emedia.leeward.hawaii.edu

Em um exemplo convincente de como "grandes" os dados e aprendizado de máquina estão começando a ter um impacto significativo em todas as facetas do conhecimento, pesquisadores da Universidade de Berkeley e da Universidade de British Columbia criaram um programa de computador que pode rapidamente reconstruir "proto-línguas" - os ancestrais linguísticos de que todas as línguas modernas evoluíram.
Estas línguas primitivos conhecidos incluem proto-indo-europeu, proto-afro-asiáticas e, neste caso, o proto-Austronesian, que deu origem às línguas faladas no sudeste da Ásia, partes da Ásia continental, Austrália e do Pacífico.


"O que me excita sobre este sistema é que leva muitas das grandes idéias que os lingüistas tiveram cerca de reconstrução histórica, e automatiza-los em uma nova escala: mais dados, mais palavras, mais idiomas, mas menos tempo", disse Dan Klein, um professor associado de ciência da computação na Universidade de Berkeley e co-autor do artigo publicado online 11 de fevereiro na revista Proceedings, da Academia Nacional de Ciências.
Modelo computacional a equipe de pesquisa usa raciocínio probabilístico - que explora a lógica e estatísticas para prever um resultado - para reconstruir mais de 600 Proto-austronésias línguas a partir de um banco de dados existente de mais de 140.000 palavras, replicando, com 85 por cento de precisão o que os lingüistas tinha feito manualmente .
Enquanto manual de reconstrução é um processo meticuloso que pode levar anos, este sistema pode realizar uma reconstrução em larga escala em uma questão de dias ou mesmo horas, disseram pesquisadores.
Não somente este programa acelerar a capacidade de lingüistas para reconstruir o mundo proto-línguas em grande escala, aumentando a nossa compreensão de civilizações antigas baseadas em seus vocabulários, mas também pode fornecer pistas sobre como as línguas podem mudar ano a partir de agora.
"Nosso modelo estatístico pode ser usado para responder perguntas científicas sobre línguas ao longo do tempo, não só para fazer inferências sobre o passado, mas também para extrapolar como a linguagem pode mudar no futuro", disse Tom Griffiths, professor associado de psicologia, diretor da UC Laboratório de Berkeley Ciência da Computação Cognitiva e outro co-autor do papel.

Os cientistas da computação têm reconstruído antiga Proto-Austronesian, que deu origem às línguas faladas na Polinésia, entre outros lugares


A missão da descoberta avanços UC Berkeley para fazer sentido de dados grandes e usar a nova tecnologia para documentar e manter línguas ameaçadas como recursos críticos para a preservação culturas e conhecimentos. Por exemplo, os pesquisadores planejam usar o mesmo modelo computacional para reconstruir indígenas norte-americanos proto-línguas.

Primeiros seres humanos registros escritos datam menos de 6.000 anos, muito tempo depois do advento de muitos proto-línguas. Enquanto arqueólogos pode vislumbrar diretos de línguas antigas em forma escrita, os lingüistas costumam usar o que é conhecido como o "método comparativo" para sondar o passado. Este método estabelece relações entre as línguas, identificar sons que mudam com regularidade ao longo do tempo para determinar se eles compartilham uma língua materna comum.
"Para entender como idioma muda - o que os sons são mais propensos a mudar e que eles vão se tornar - requer reconstrução e análise de grandes quantidades de formas de palavras ancestrais, que é onde reconstruções automáticas desempenhar um papel importante", disse Alexandre Bouchard-Côté, professor assistente de estatística da Universidade da Colúmbia Britânica e principal autor do estudo, que começou quando um estudante de pós-graduação na Universidade de Berkeley.
A UC Berkeley modelo computacional é baseado na teoria linguística estabelecido que as palavras evoluem ao longo dos ramos de uma árvore de família - bem como uma árvore genealógica - refletindo as relações linguísticas que evoluem ao longo do tempo, com as raízes e os nós que representam proto-línguas e as deixa representando línguas modernas.
Usando um algoritmo conhecido como a cadeia de Monte Carlo Markov amostrador, o programa ordenadas por meio de conjuntos de cognatos, palavras em línguas diferentes que partilham um som comum, história e origem, para calcular as probabilidades de que estabelecem que é derivado do proto-língua. Em cada etapa, armazenada uma reconstrução hipótese para cada cognato e cada língua ancestral.
"Porque o som muda e reconstruções estão intimamente ligados, o nosso sistema de usa-los para melhorar repetidamente o outro", disse Klein. "É primeira corrige as suas mudanças de som previstos e deduz reconstruções melhores das antigas formas. Ele então corrige os reconstruções e re-analisa as alterações de som. Estes passos são repetidos, e ambas as previsões melhorar gradualmente como a estrutura subjacente emerge ao longo do tempo."
MessageToEagle.com

Nenhum comentário:

Postar um comentário