Strange results for the Mask Task
I tried a popular Brazilian saying 'quem tem boca vai a [MASK]'. There are 21K occurrences of 'quem tem boca vai a roma' in the web, but this is what it returns:
[{'score': 0.09806757420301437,
'token': 1998,
'token_str': 'luta',
'sequence': 'quem tem boca vai a luta.'},
{'score': 0.02977180853486061,
'token': 1658,
'token_str': 'guerra',
'sequence': 'quem tem boca vai a guerra.'},
{'score': 0.028615901246666908,
'token': 4939,
'token_str': 'festa',
'sequence': 'quem tem boca vai a festa.'},
{'score': 0.020799588412046432,
'token': 5309,
'token_str': 'pé',
'sequence': 'quem tem boca vai a pé.'},
{'score': 0.019497394561767578,
'token': 2375,
'token_str': 'frente',
'sequence': 'quem tem boca vai a frente.'}]
Tried many other phrases, and for most of them, the results were very disappointing.