O Google Tradutor anunciou em julho de 2024 a maior expansão de sua história, adicionando 110 novos idiomas ao seu sistema.
A atualização, impulsionada por avanços em inteligência artificial, inclui línguas faladas por comunidades minoritárias, dialetos indígenas e idiomas africanos historicamente sub-representados.
Principais destaques da atualização
Tecnologia por trás da expansão
- Modelo PaLM 2: Utilizado para interpretar padrões linguísticos e adicionar idiomas com poucos recursos digitais, como o Awadhi (Índia) e o Seychellois Creole (Seicheles).
- Tradução Zero-Shot: Permite traduzir idiomas mesmo sem dados bilíngues pré-existentes, essencial para línguas com escassez de registros.
Línguas adicionadas
- Africanas: Fon (Benim), Wolof (Senegal), Venda (África do Sul), Ga (Gana) e Kikongo (Angola/República Democrática do Congo).
- Indígenas/Revitalizadas: Manx (Ilha de Man), quase extinto na década de 1970, e Romani (Europa).
- Variantes Regionais: Punjabi em Shahmukhi (Paquistão), escrita em alfabeto perso-árabe.
Impacto demográfico
- A atualização beneficia 614 milhões de pessoas (8% da população global), priorizando idiomas com alto valor cultural, mesmo que falados por comunidades menores.
Desafios e critérios de inclusão
Padronização: Idiomas com múltiplos dialetos, como o Romani, exigem adaptações para evitar generalizações.
Caracteres Compartilhados: Línguas como o Cantonês demandaram ajustes devido à sobreposição de caracteres com o Mandarim.
Fontes de Dados: Foram usados textos religiosos, literários e contribuições de falantes nativos para treinar a IA.
Iniciativa 1.000 idiomas
A expansão faz parte do projeto “1.000 Idiomas”, que visa dar suporte digital aos principais idiomas globais até 2030. O foco inclui:
- Preservação: Digitalizar línguas em risco de extinção, como o N|uu (África do Sul), falado por menos de 10 pessoas.
- Acessibilidade: Garantir que minorias linguísticas tenham acesso a serviços básicos, como educação e saúde, em seus idiomas.
- VEJA TAMBÉM:
- Google Tradutor 6 Funções ùteis e pouca usada!
A adição de 110 idiomas ao Google Tradutor reforça o compromisso da empresa com a inclusão linguística. Embora desafios técnicos e culturais persistam, a combinação de IA e colaboração com comunidades locais tem sido crucial para preservar e revitalizar línguas ameaçadas.
Próximos Passos: O Google planeja incluir mais 50 idiomas até o final de 2024, com ênfase em línguas indígenas das Américas e da Oceania.