Parámetros de Python són iguales a los parámetros largos (--parámetro) de Terminal, si no es especificado de otra manera. Las banderas son designadas como cierto o falso (True/False) en Python. El manuál para cualquier modulo de gget se puede obtener desde Terminal con la bandera -h --help.

gget archs4 🐁

Encuentra los genes más correlacionados a un gen de interés, o bién, encuentra los tejidos donde un gen se expresa usando la base de datos ARCHS4.
Produce: Resultados en formato JSON (Terminal) o Dataframe/CSV (Python).

Parámetro posicional
gene
Nombre corto (símbolo del gen) del gen de interés, p. ej. STAT4.
Alternativamente: usa la bandera --ensembl para ingresar un ID tipo Ensembl, p. ej. ENSG00000138378.

Parámetros optionales
-w --which
'correlation' (correlación; se usa por defecto) o 'tissue' (tejido).
'correlation' produce una tabla que contiene los 100 genes más correlacionados con el gen de interés. La correlación de Pearson se calcula de todas las muestras y tejidos en ARCHS4.
'tissue' produce un atlas de expresión tisular calculado de todas las muestras humanas o de ratón (según lo definido usando el parámetro --species (especies)) en ARCHS4.

-s --species
'human' (humano; se usa por defecto) o 'mouse' (ratón).
Define si se usan muestras humanas o de ratón de ARCHS4.
(Solo aplica para el atlas de expresión tisular.)

-o --out
Ruta al archivo en el que se guardarán los resultados, p. ej. ruta/al/directorio/resultados.csv (o .json). Por defecto: salida estándar (STDOUT).
Para Python, use save=True para guardar los resultados en el directorio de trabajo actual.

Banderas
-e --ensembl
Usa esta bandera si gene se ingresa como ID tipo Ensembl.

-csv --csv
Solo para Terminal. Produce los resultados en formato CSV.
Para Python, usa json=True para obtener los resultados en formato JSON.

-q --quiet
Solo para Terminal. Impide la información de progreso de ser exhibida durante la ejecución del programa.
Para Python, usa verbose=False para impedir la información de progreso de ser exhibida durante la ejecución del programa.

Ejemplo

gget archs4 ACE2
# Python
gget.archs4("ACE2")

→ Produce los 100 genes más correlacionados con el gen ACE2:

gene_symbolpearson_correlation
SLC5A10.579634
CYP2C180.576577
. . .. . .



gget archs4 -w tissue ACE2
# Python
gget.archs4("ACE2", which="tissue")

→ Produce la expresión tisular de ACE2 (por defecto, se utilizan datos humanos):

idminq1medianq3max
System.Urogenital/Reproductive System.Kidney.RENAL CORTEX0.1136448.2740609.69584010.5167011.21970
System.Digestive System.Intestine.INTESTINAL EPITHELIAL CELL0.1136445.9055609.57045013.2647013.83590
. . .. . .. . .. . .. . .. . .



Consulte este tutorial de Dave Tang, quien escribió un script R para crear esta visualización con los resultados de gget archs4 en formato JSON:

image

Más ejemplos

Citar

Si utiliza gget archs4 en una publicación, favor de citar los siguientes artículos:

  • Luebbert, L., & Pachter, L. (2023). Efficient querying of genomic reference databases with gget. Bioinformatics. https://doi.org/10.1093/bioinformatics/btac836

  • Lachmann A, Torre D, Keenan AB, Jagodnik KM, Lee HJ, Wang L, Silverstein MC, Ma’ayan A. Massive mining of publicly available RNA-seq data from human and mouse. Nature Communications 9. Article number: 1366 (2018), doi:10.1038/s41467-018-03751-6

  • Bray NL, Pimentel H, Melsted P and Pachter L, Near optimal probabilistic RNA-seq quantification, Nature Biotechnology 34, p 525--527 (2016). https://doi.org/10.1038/nbt.3519