Questions sur pandas

4
réponses

Comment rééchantillonner une dataframe avec différentes fonctions appliquées à chaque colonne?

j'ai une série de temps avec la température et le rayonnement dans un pandas dataframe . La résolution temporelle est d ... d'une heure, en calculant le horaire moyen pour la température et le horaire "somme pour le rayonnement?
demandé sur 2012-04-05 03:17:23
1
réponses

multiprocesseur en python-partage d'un grand objet (par exemple, une base de données pandas) entre plusieurs processus

j'utilise Python multiprocessing, plus précisément from multiprocessing import Pool p = Pool(15) args = [(df, ... enant un peu confus. Quelles options y a-t-il pour partager la mémoire, et laquelle serait la meilleure dans ce cas?
demandé sur 2014-03-18 21:56:48
4
réponses

Calculer la moyenne pondérée à l'aide d'un cadre pandas / data

j'ai le tableau suivant. Je veux calculer une moyenne pondérée regroupés par chaque date selon la formule ci-dessous. ... + 1.0 * (100/somme(60,80,100)) 01/02/2012 w_avg = 0.5 * ( 100/ somme(100,80)) + 1.0 * ( 80/ somme(100,80))
demandé sur 2014-10-05 22:36:05
4
réponses

Fusionner les DataFrames de pandas où une valeur se situe entre deux autres [dupliquer]

cette question a déjà une réponse ici: comment joindre deux dataframes pour lesqu ... éviter d'avoir une base de données potentiellement très grande après la fusion mais avant que le filtre ait terminé.
demandé sur 2015-06-03 21:33:39
12
réponses

Python Pandas - comment aplatir un index hiérarchique en colonnes

j'ai un bloc de données avec un index hiérarchique dans l'axe 1 (colonnes) (à partir d'un groupby.apa fonctionnement): ... 969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}
demandé sur 2013-01-24 22:03:11
3
réponses

Remplacement des données de catégorie (pandas)

j'ai quelques gros fichiers avec plusieurs colonnes de catégories. Catégorie est un peu un mot généreux aussi parce qu ... chiers est presque impossible en raison de la répartition de l'espace disque partagé pendant plus de quelques mois.
demandé sur 2015-05-11 19:38:00
4
réponses

Comment itérer efficacement sur des morceaux consécutifs de la dataframe Pandas

j'ai une grande base de données (plusieurs millions de lignes). je veux être capable de faire une opération g ... ex est clairsemé ou non-entier ou n'importe quoi. des suggestions pour une meilleure façon? Merci!
demandé sur 2014-09-06 14:46:50
9
réponses

Création de variables fictives dans pandas pour python

j'essaie de créer une série de variables fictives à partir d'une variable catégorique en utilisant pandas en python. J ... ory']) voir http://blog.yhathq.com/posts/logistic-regression-and-python.html pour plus d'informations.
demandé sur 2012-07-21 02:33:29
4
réponses

Ajouter plusieurs colonnes à DataFrame et les mettre égales à une colonne existante

je veux ajouter plusieurs colonnes à une pandas DataFrame et les mettre égales à une colonne existante. Est-il une fa ... ultat est KeyError: "['b' 'c'] not in index" : df = pd.DataFrame({'a': np.arange(1,6)}) df[['b','c']] = df.a
demandé sur 2017-04-14 19:50:18
3
réponses

Pandas: rééchantillonnage des séries chronologiques avec groupby

étant donné la base de données pandas ci-dessous: In [115]: times = pd.to_datetime(pd.Series(['2014-08-25 21:00 ... j'ai essayé diverses combinaisons de resample() et groupby() mais sans succès. Comment pourrais-je aller à ce sujet?
demandé sur 2015-08-14 17:04:02
1
réponses

Opérateur logique pour l'indexation booléenne dans les Pandas

je travaille avec l'index booléen dans Pandas. La question est pourquoi la déclaration: a[(a['some_column']==so ... 10)] Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
demandé sur 2014-01-29 00:04:04
3
réponses

Pandas: savoir quand une opération affecte le dataframe original

j'adore pandas et je l'utilise depuis des années et je me sens assez confiant j'ai une bonne maîtrise sur la façon de ... l quand boolean d'indexation .loc, .query() , ou .copy() est utilisé pour créer la nouvelle base de données
demandé sur 2018-01-09 20:49:10
14
réponses

Comment itérer sur des lignes dans une DataFrame dans Pandas?

j'ai un DataFrame de pandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2 ... row in df.iterrows(): mais je ne comprends pas ce qu'est l'objet row et comment je peux travailler avec lui.
demandé sur 2013-05-10 11:04:49
6
réponses

Comment insérer une base de données pandas via mysqldb dans une base de données?

je peux me connecter à ma base de données mysql locale à partir de python, et je peux créer, sélectionner et insérer d ... script python pour une table très simple avec ID et deux colonnes de données, et une base de données correspondante?
demandé sur 2013-05-10 10:29:10
10
réponses

Comment puis-je accélérer la lecture de plusieurs fichiers et de mettre les données dans une base de données?

j'ai un certain nombre de fichiers texte, disons 50, que je dois lire dans une base de données massive. En ce moment, ... 4 Mes fichiers d'entrée: essai1.txt a 1 b 2 end essai2.txt c 3 d 4 end
demandé sur 2017-02-10 14:10:20
2
réponses

Python Pandas: indexation booléenne sur plusieurs colonnes [dupliquer]

cette question a déjà une réponse ici: sélectionnant à travers plusieurs colonnes ... t il scores assez faible pour la lisibilité (je pense). y a-t-il une meilleure façon, plus Python-tastique?
demandé sur 2013-06-20 18:21:32
3
réponses

Compte de Pandas (distinct) équivalent

j'utilise pandas comme un substitut de db car j'ai plusieurs bases de données (oracle, mssql, etc) et je suis incapabl ... et le résultat serait 201301 5000 201302 13245 Comment puis-je faire cela les pandas?
demandé sur 2013-03-14 17:50:03
3
réponses

Comment supprimer une colonne d'un data frame avec pandas?

j'ai lu mes données import pandas as pd df = pd.read_csv('/path/file.tsv', header=0, delimiter='\t') print df ... rint df.drop('id', 1) mais il soulève cette exception: ValueError: labels ['id'] not contained in axis
demandé sur 2015-01-20 03:22:23
4
réponses

Remplacer Pandas ou Num Py Nan par un None à utiliser avec MysqlDB

j'essaie d'écrire une base de données Pandas (ou peut utiliser un tableau numpy) à une base de données mysql en utilis ... la liste des champs. J'ai besoin de trouver un moyen de convertir le " nan " dans un NoneType. des idées?
demandé sur 2013-01-04 22:26:06
1
réponses

Quelles règles Pandas utiliser pour générer une vue vs une copie?

Je suis confus au sujet des règles Pandas utilise en décidant qu'une sélection à partir d'une base de données est une ... ple-modifier les valeurs (ou un sous-ensemble de valeurs) dans un datagramme qui satisfait une requête particulière.
demandé sur 2014-04-25 18:44:07