Traduza informações de seu dataset



Senhores, quem de vocês já não precisou traduzir algo em seu dataset, e queria fazer isso de forma automática?

Pois bem, as vezes queremos fazer isso nos títulos das inúmeras colunas de nosso dataset, as vezes dentro das séries ou das listas.

Eu comecei meus testes com o translate do python, mas, ele tem um limite pequeno de requests para o 'plano free'.

Pensei que teria que fazer um Scraping com BeautifulSoup, mas não, consegui encontrar e montar pra turma uma solução bem interessante.

A solução está disposta no meu GUTHUB e no COLAB (pra quem quiser copiar)

 Github                      

O algoritmo consiste na utilização da biblioteca googletrans , e tudo funcionou bem...será?! não...tive que fazer uns ajustes.

Explico no inicio do projeto, como funciona a biblioteca (fácil demais), e ao simular em uma lista, percebi que algumas vezes ela não traduzia, ou se fazia, o response era o próprio texto na língua original.

Então, criei um loop, a estilo "burro do Shreck", que se percebeu que o texto não traduziu, ele espera alguns segundos, e tenta denovo...até conseguir.

Minha dica aqui é que você aumente esse Sleep, pois 10 segundos ali, é para fins didáticos. 

A explicação pode ser que, o GOOGLE tem um API de tradutor, o qual você paga por strings, logo, pra usar algo de graça, tem que ter alguma limitação mesmo.

A solução que eu montei foi para contornar, de forma paleativa, esse problema.

No final do código mostro como aplicar esse conceito através de APPLY + LAMBDA na coluna do DATAFRAME PANDAS.

Espero que gostem, e que esse código possa vir a te ajudar, e, abrir a mente para outras possibilidades.


Forte abraço,



Conheça meu trabalho

joviano.com joviano.com joviano.com joviano.com joviano.com

Conheça os cursos que fiz para você

joviano.com

Comentários

Postagens mais visitadas deste blog

Queimadas no Brasil [2012 a 2019]

Cotações de Moedas e Ações com Python