Datasources

Chaque projet est lié à des datasources. Ces datasources ont 3 types : vertex, simplifiedEdge et cases. Pour y accéder, nous pouvons faire:

db1 = my_project.nodes_datasource # Pour les sommets
db2 = my_project.edges_datasource # For simplifiedEdge
db3 = my_project.cases_datasource # Pour les cas

Ces datasources sont des objets Python qui peuvent être utilisés pour faciliter l'accès aux données correspondantes. Une fois créées, elles sont vides et doivent être sollicitées pour que les données puissent être récupérées.

La façon la plus simple de le faire est d'utiliser la méthode .load_dataframe(), qui est équivalente à une requête SELECT * FROM [datasource]. Optionnellement, le paramètre load_limit peut être utilisé pour récupérer un sous-ensemble du dataframe. Cette méthode renvoie un Pandas Dataframe.

df = db1.load_dataframe(load_limit=10) # charge 10 lignes de nodes_datasource

Vous pouvez également renvoyer une liste de toutes les datasources associées au groupe de travail. Notez que dans ce cas, tous les types de datasources sont renvoyés dans la même liste :

datasources_list = wg.datasources

S'il y a des connexions ouvertes, elles peuvent être fermées si nécessaire :

wg = Workgroup(w_id, w_key, api_url, auth_url)
p = Project("<Votre ID de projet>", wg.api_connector)
ds = Datasource("<Votre nom de source de données>", "<Votre type de source de données>", "<Votre hôte>", "<Votre port>", p)
ds.close()