Questions sur nlp

4
réponses

génération d'étiquettes à partir d'un contenu texte

je suis curieux de savoir s'il existe un algorithme/une méthode pour générer des mots-clés/Étiquettes à partir d'un te ... je vous serais reconnaissant si vous pointez une solution / bibliothèque basée sur Python pour cela. Merci
demandé sur 2010-04-18 13:39:23
6
réponses

Qu'est-ce qu'une bonne bibliothèque de filtres de profanation Python? [fermé]

Like https://stackoverflow.com/questions/1521646/best-profanity-filter , mais pour Python - et je suis à la reche ... iter les questions de contenu. J'aimerais juste trouver une bonne bibliothèque, et voir à quoi je peux m'en servir.)
demandé sur 2010-08-20 18:20:37
5
réponses

Y a-t-il des API pour l'analyse de texte/extraction en Java? [fermé]

je veux savoir s'il y a une API pour faire l'analyse de texte en Java. Quelque chose qui peut extraire tous les mots d ... nalyse de texte en Java? EDIT: de Text-mining, je veux minier le texte. Une API pour Java qui fournit ceci.
demandé sur 2011-07-23 16:56:34
6
réponses

Les données de formation pour l'analyse des sentiments [fermé]

Où puis-je obtenir un corpus de documents qui ont déjà été classés comme positifs/négatifs pour le sentiment dans le d ... corpus pour le domaine des affaires comprenant des revues d'entreprises, qui correspondent au langage des affaires?
demandé sur 2011-09-26 10:18:54
20
réponses

Comment puis-je procéder à un écaillage de mots ou à une lemmatisation?

J'ai essayé PorterStemmer et boule de neige, mais les deux ne fonctionnent pas sur tous les mots, manquant certains tr ... e de bourrage qui produit des mots réels Découlant des exemples de code ou de projets open source?
demandé sur 2009-04-21 14:07:03
3
réponses

Remplacer appostrophe / short words en python

j'utilise python pour nettoyer une phrase donnée. Supposons que ma phrase soit: What's the best way to ensure t ... riel, et ainsi de suite. je suis en train d'explorer textlob. Mais tout ce qui précède n'est pas possible.
demandé sur 2017-03-25 18:11:07
8
réponses

Calcul de N grammes en utilisant Python

j'ai dû calculer les Unigrammes, bigrammes et trigrammes pour un fichier texte contenant du texte comme: " la ... omme dans le kystique et la fibrose ou la fibrose kystique. Quelqu'un peut m'aider comment je peux obtenir ce fait?
demandé sur 2012-11-17 00:26:35
18
réponses

Comment ça, "Google"?"L'algorithme fonctionne?

j'ai développé un site Web interne pour un outil de gestion de portefeuille. Il y a beaucoup de données textuelles, d ... frappe pour chaque terme "connu" ou "correct" et effectuer des recherches? une autre méthode plus élégante?
demandé sur 2008-11-21 02:34:51
1
réponses

Échec de la commande Java au NLTK Stanford POS Tagger

je vous demande votre aide et votre aide pour résoudre l'erreur de" Java Command Fails " qui n'arrête pas de lancer cha ... 0 mots à la fois, je vais devoir répéter la tâche 3000 fois. Ça va me tuer! j'apprécie vraiment votre aide.
demandé sur 2014-11-25 03:02:10
7
réponses

Comment détecter la langue du texte saisi par l'utilisateur? [fermé]

il s'agit d'une application qui accepte les entrées de l'utilisateur dans différentes langues (actuellement 3 langues ... r SI (et quelques autres): comment détecter la langue comment détecter la langue du texte?
demandé sur 2010-07-12 14:07:28
11
réponses

Comment déterminer le langage (naturel) d'un document?

j'ai un ensemble de documents dans les deux langues: l'anglais et l'allemand. Il n'y a pas de méta-information utilisa ... e n'ai pas le temps de devenir un expert en langage naturel le traitement, bien qu'il s'agisse d'un sujet intrigant.
demandé sur 2009-09-05 18:50:31
8
réponses

Un analyseur StringToken qui donne le style de recherche Google" Did you mean: "Suggestions

la Recherche d'une méthode pour: prendre des jetons séparés par des espaces dans une chaîne de caractères; re ... s fonctionnalités? ou Existe-t-il un moyen d'utiliser une API Google pour demander un mot suggéré?
demandé sur 2008-09-26 00:19:43
3
réponses

Qu'est-ce qu'une bonne bibliothèque Java pour le marquage des parties de la Parole? [fermé]

je suis à la recherche d'un bon open source POS Tagger en Java. Voici ce que j'ai mis au point jusqu'à présent. ... LingPipe Stanford LBJ FastTag Quelqu'un a des recommandations?
demandé sur 2010-02-19 05:08:41
1
réponses

Python NLTK POS tagger ne se comporte pas comme prévu

j'ai lancé la fonction pos_tag sur le texte ci-dessous,il affiche la sortie avec la batterie comme 'RB'. Comme battery ... ), ('la vie', 'NN'), ('a', 'VBD'), ('non', 'RB'), ('qui', 'EN'), ('good',' JJ')] Veuillez expliquer!
demandé sur 2014-02-14 21:55:13
17
réponses

Remplacement des nombres ordinaux

je cherche actuellement le moyen de remplacer des mots comme premier, deuxième, troisième,...avec une représentation o ... lors y en a-t-il ou devrais-je écrire quelques expressions régulières manuellement? Merci pour tout conseil
demandé sur 2012-03-10 18:27:49
4
réponses

Que signifient les étiquettes "partie de la parole" et "dépendance" de spaCy?

spaCy marque chacun des Token dans un Document avec une partie de la parole (dans deux formats différents, un stocké da ... er. Quelles sont les valeurs possibles des propriétés tag_ , pos_ , et dep_ , et que signifient-elles?
demandé sur 2016-10-27 18:14:32
4
réponses

En utilisant NLTK et WordNet; comment convertir simple verbe tendu dans son présent, passé ou passé forme de participe?

en utilisant NLTK et WordNet , Comment puis-je convertir le verbe au temps simple dans sa forme actuelle, passée ... v = 'go' present = present_tense(v) print present # prints "going" past = past_tense(v) print past # prints "went"
demandé sur 2010-09-20 19:36:30
2
réponses

Générer des questions à partir du texte (NLP)

quelles approches y a-t-il pour générer une question à partir d'une phrase? Disons que j'ai une phrase "de Jim chien é ... e de générer une question comme "qu'est Ce que Jim chien sentait?"ou" comment était le chien de Jim?" Merci!
demandé sur 2011-07-25 15:22:00
4
réponses

Comment extraire des phrases communes / significatives d'une série d'entrées textuelles

j'ai une série d'éléments de texte - HTML brut à partir d'une base de données MySQL. Je veux trouver les phrases les p ... a semble être un problème assez commun et je n'ai pas été en mesure de trouver une solution simple en cherchant ici.
demandé sur 2010-03-16 11:42:38
10
réponses

comment vérifier si une chaîne, randomisée, ou d'origine humaine et pronouncable?

dans le but d'identifier les noms d'utilisateur générés par bot. supposons que vous ayez un nom d'utilisateur ... nçables à l'intérieur une chaîne comme celle-ci? Solutions applicables en PHP / MySQL les plus appréciées.
demandé sur 2009-07-22 13:48:14