Tucano - Literatura, Enciclopédia e Listas Temáticas

Este dataset reúne uma coleção diversificada de traduções para a língua Tucano, abrangendo literatura brasileira, conhecimento enciclopédico, listas vocabulares e notícias. Representa um corpus de alta diversidade temática e tipológica.

Conteúdo Abrangido:Literatura: Estatuto do Homem de Thiago de Mello (90 traduções) • Enciclopédia: Resumos da Wikipedia (186 traduções) • Vocabulário: Lista Google Woolaroo (514 traduções) • Jornalismo: 2 notícias (G1 e BBC - 138 traduções)

Características: - 928 traduções válidas distribuídas em 5 recursos - Alta diversidade temática (4 tipos diferentes de conteúdo) - Fontes oficiais e tecnológicas (Wikipedia, Google, G1, BBC)

Fontes Representadas: - Literatura Brasileira (Thiago de Mello - manifesto humanista) - Wikipedia (conhecimento enciclopédico via API) - G1 Amazonas (seca e nível do Rio Negro) - BBC Brasil (capoeira e break dancing)

Diversidade Temática: - Direitos humanos e poesia social - Geografia e história do Brasil - Vocabulário tecnológico moderno - Questões ambientais amazônicas - Cultura e tradições brasileiras

Este dataset representa um marco na diversificação do corpus da língua Tukano, combinando tradição literária, conhecimento enciclopédico, tecnologia moderna e informação jornalística.

Processamento: Adriel Santos Mantenedor: ISLA - Instituto de Sustentabilidade Linguística da Amazônia

Dados e recursos

Informações Adicionais

Campo Valor
Autor
Mantenedor ISLA
Última Atualização agosto 24, 2025, 23:30 (UTC)
Criado agosto 22, 2025, 07:49 (UTC)
author_featured Thiago de Mello
language Tukano (tuo)
processed_by Adriel Santos
processing_date 2024-12
quality_status Validado
sources Thiago de Mello, Wikipedia, Google Woolaroo, G1, BBC
technological_component Google Woolaroo Project
theme Literatura, Enciclopédia e Listas Temáticas
translation_pairs 928