Notre site professionnel vous permet de trouver un programmeur grâce à notre système d'annonce de projet informatique. Le site est gratuit et les offres déposées proviennent de France uniquement.
Nous prônons le 'Made in France' en privilégiant la qualité à la quantité.

Premier site d'annonces informatiques

Déposez gratuitement votre annonce et recevez des offres françaises uniquement.
Titre de l'annonce :collecte tweets
Prix
500
Délai
1mois
Environnement technique : programmation
Description :

collecte d'un corpus fait de tweets par exemple (vous pouvez utiliser
l'API Tweeter et collecter avec Talend si à l'aise avec java, sinon
vous pouvez collecter les tweets et travailler ensuite en C).
Les tweets comportent des hashtags, si la collecte se fait sur une
période il y a +hashtags qui se présentent. L'idée serait de
classifier les hashtags selon les catégories que vous aurez fixé au
préalable et ensuite construire un lexique sémantique avec des mots
qui font partie de ces catégories mais qui ne sont pas des hashtags.
Si cela vous intéresse vous devez travailler pour collectionner votre corpus.
Ensuite vous pouvez associer des catégories aux hashtags, ensuite
tokenisation des tweets (d'abord on enlève les mots grammaticaux),
TF-IDF pour voir éventuellement les thèmes via les fréquences et
création lexique suivant des critères que vous aurez fixé au préalable
(je vous aiderai là-dessus)
vous pouvez utiliser des outils existant ou vous en inspirez (ex.:
http://texlexan.sourceforge.net [2])


1
nb devis: