✨ ¡Lo más reciente!
Versión ≥ 0.29.0 (25 de septiembre de 2024):
- Nuevos módulos:
gget enrichr
ahora también soporta especies además de humano y ratón (mosca, levadura, gusano y pez) a través de modEnrichRgget mutate
:
gget mutate
ahora fusionará secuencias idénticas en el archivo final por defecto. La creación de mutaciones fue vectorizada para disminuir el tiempo de ejecución. Se mejoró la verificación de la secuencia flanqueante para mutaciones no sustitutivas para asegurarse de que no se retenga ningún kmer silvestre en la secuencia que contiene la mutación. Se agregó varios nuevos argumentos para personalizar la generación de secuencias y la salida.gget cosmic
:
Se agregó soporte para pantallas de genes así como dirigidas. El archivo CSV creado para gget mutate ahora también contiene información sobre mutaciones de proteínas.gget ref
:
Se agregó opción de archivo de salida.gget info
ygget seq
:
Se cambió a la API POST de Ensembl para aumentar la velocidad (nada cambia en el front end).- Otros cambios "detrás de escena":
- Pruebas unitarias reorganizadas para aumentar la velocidad y disminuir el código
- Requisitos actualizados para permitir versiones más nuevas de mysql-connector
- Soporte para Numpy>= 2.0
Versión ≥ 0.28.6 (2 de junio de 2024):
- Nuevo módulo:
gget mutate
gget cosmic
: Ahora puedes descargar bases de datos completas de COSMIC utilizando el argumentodownload_cosmic
gget ref
: Ahora puede obtener la ensambladura del genoma GRCh27 usandospecies='human_grch37'
gget search
: Ajusta el acceso a los datos humanos a la estructura de la versión 112 de Ensembl (corrige issue 129)
Version ≥ 0.28.5 (May 29, 2024):
- Retirado debido a un error con 'logging' en
gget.setup("alphafold")
+ mutaciones de inversión engget mutate
solo invierten la cadena en lugar de también calcular la hebra complementaria
Versión ≥ 0.28.4 (31 de enero de 2024):
gget setup
: soluciona el error con la ruta del archivo al ejecutargget.setup("elm")
en el sistema operativo Windows.
Versión ≥ 0.28.3 (22 de enero de 2024):
gget search
ygget ref
ahora también admiten hongos 🍄, protistas 🌝 y metazoos de invertebrados 🐝 🐜 🐌 🐙 (además de vertebrados y plantas)- Nuevo módulo:
gget cosmic
gget enrichr
: corrige puntos de dispersión duplicados en el gráfico cuando los nombres de las rutas están duplicadosgget elm
:- Se cambió el nombre de la columna de resultados orto 'Ortholog_UniProt_ID' a 'Ortholog_UniProt_Acc' para reflejar correctamente el contenido de la columna, que son accesos de UniProt. 'UniProt ID' se cambió a 'UniProt Acc' en la documentación para todos los módulos
gget
. - Se cambió el nombre de la columna de resultados ortogonales 'motif_in_query' a 'motif_inside_subject_query_overlap'.
- Se agregó información del dominio de interacción a los resultados (nuevas columnas: "InteractionDomainId", "InteractionDomainDescription", "InteractionDomainName").
- La cadena de expresiones regulares para coincidencias de expresiones regulares se encapsuló de la siguiente manera: "(?=(regex))" (en lugar de pasar directamente la cadena de expresiones regulares "regex") para permitir capturar todas las apariciones de un motivo cuando la longitud del motivo es variable y hay son repeticiones en la secuencia (https://regex101.com/r/HUWLlZ/1).
- Se cambió el nombre de la columna de resultados orto 'Ortholog_UniProt_ID' a 'Ortholog_UniProt_Acc' para reflejar correctamente el contenido de la columna, que son accesos de UniProt. 'UniProt ID' se cambió a 'UniProt Acc' en la documentación para todos los módulos
gget setup
: utilice el argumentoout
para especificar un directorio en el que se descargará la base de datos ELM. Completa esta solicitud de función.gget Diamond
: El comando DIAMOND ahora se ejecuta con el indicador--ignore-warnings
, lo que permite secuencias de nicho, como secuencias de aminoácidos que solo contienen caracteres de nucleótidos y secuencias repetidas. Esto también es válido para las alineaciones DIAMOND realizadas dentro degget elm
.- Cambio de back-end de
gget ref
ygget search
: la versión actual de Ensembl se obtiene del nuevo archivo de versión en el sitio FTP de Ensembl para evitar errores durante la carga de nuevos lanzamientos. gget search
:- Los resultados del enlace FTP (
--ftp
) se guardan en formato de archivo txt en lugar de json. - Se corrigieron enlaces URL al resumen de genes de Ensembl para especies con un nombre de subespecie e invertebrados.
- Los resultados del enlace FTP (
gget ref
:- Cambios de back-end para aumentar la velocidad.
- Nuevo argumento:
list_iv_species
para enumerar todas las especies de invertebrados disponibles (se puede combinar con el argumentorelease
para obtener todas las especies disponibles de una liberación específica de Ensembl)
Versión ≥ 0.28.2 (15 de noviembre de 2023):
gget info
: devuelve un mensaje de error cuando el servidor NCBI falla por un motivo distinto a un error de recuperación (esto es un error en el lado del servidor en lugar de un error congget
)- Reemplace el argumento obsoleto 'texto' para los métodos de tipo find() siempre que se usen con la dependencia
BeautifulSoup
gget elm
: Elimina instancias de falsos positivos y verdaderos negativos de los resultados devueltos.gget elm
: agrega el argumentoexpand
Versión ≥ 0.28.0 (5 de noviembre de 2023):
- Documentación actualizada de
gget muscle
para agregar un tutorial sobre cómo visualizar secuencias con diferentes longitudes de nombres de secuencia + ligero cambio en la visualización devuelta para que sea un poco más sólida ante diferentes nombres de secuencia gget muscle
ahora también permite una lista de secuencias como entrada (como alternativa a proporcionar la ruta a un archivo FASTA)- Permitir filtro de genes faltante para
gget cellxgene
(corrige error) gget seq
: permite nombres de genes faltantes (correccione [https://github.com/pachterlab/gget/issues/107](https://github.com/pachterlab/gget /números/107))- Nuevos argumentos para
gget enrichr
: use el argumentokegg_out
ykegg_rank
para crear una imagen de la vía KEGG con los genes del análisis de enriquecimiento resaltados (gracias a [este PR](https ://github.com/pachterlab/gget/pull/106) por Noriaki Sato) - Nuevos módulos:
gget elm
ygget Diamond
Versión ≥ 0.27.9 (7 de agosto de 2023):
- Nuevos argumentos para
gget enrichr
: use el argumentobackground_list
para proporcionar una lista de genes 'background' gget search
ahora también busca sinónimos Ensembl (además de nombres y descripciones de genes) para obtener resultados de búsqueda más completos (gracias a Samuel Klein por la sugerencia)
Versión ≥ 0.27.8 (12 de julio de 2023):
- Nuevo argumento para
gget search
: especifique la versión de Ensembl desde la cual se obtiene la información con-r
--release
- Se corrigió un error en
gget pdb
(este error se introdujo en la versión 0.27.5)
Versión ≥ 0.27.7 (15 de mayo de 2023):
- Se movieron las dependencias para los módulos
gget gpt
ygget cellxgene
de los requisitos instalados automáticamente agget setup
- Dependencias
gget alphafold
actualizadas para compatibilidad con Python >= 3.10 - Se agregó el argumento
census_version
agget cellxgene
Versión ≥ 0.27.6 (1 de mayo de 2023) (TIRO debido a problemas con las dependencias -> reemplazada por la versión 0.27.7):
- Gracias a el PR de Tomás Di Domenico:
gget search
ahora también puede consultar los ID de plantas 🌱 Ensembl - Nuevo módulo:
gget cellxgene
Versión ≥ 0.27.5 (6 de abril de 2023):
- Se actualizó
gget search
para que funcione correctamente con la nueva versión de Pandas 2.0.0 (lanzado el 3 de abril de 2023), además de versiones anteriores de Pandas - Se actualizó
gget info
con nuevos banderasuniprot
yncbi
que permiten desactivar los resultados de estas bases de datos de forma independiente para ahorrar tiempo de ejecución (nota: el indicadorensembl_only
quedó obsoleto) - Todos los módulos gget ahora tienen una bandera
-q / --quiet
(para Python:verbose=False
) para desactivar la información de progreso
Versión ≥ 0.27.4 (19 de marzo de 2023):
- Nuevo módulo:
gget gpt
Versión ≥ 0.27.3 (11 de marzo de 2023):
gget info
excluye los ID de PDB de forma predeterminada para aumentar la velocidad (los resultados de PDB se pueden incluir usando la marca--pdb
/pdb=True
).
Versión ≥ 0.27.2 (1 de enero de 2023):
- Se actualizó
gget alphafold
a DeepMind's AlphaFold v2.3.0 (incluidos los nuevos argumentosmultimer_for_monomer
ymultimer_recycles
)
Versión ≥ 0.27.0 (10 de diciembre de 2022):
- Se actualizó
gget alphafold
para que coincida con los cambios recientes de DeepMind - Número de versión actualizado para que coincida con la edad de el creador de gget siguiendo una larga tradición de laboratorio de Pachter
Versión ≥ 0.3.13 (11 de noviembre de 2022):
- Tiempo de ejecución reducido para
gget enrichr
ygget archs4
cuando se usa con ID de Ensembl
Versión ≥ 0.3.12 (10 de noviembre de 2022):
gget info
ahora también devuelve datos de localización subcelular de UniProt- El nuevo indicador
gget info
ensembl_only
devuelve solo los resultados de Ensembl - Tiempo de ejecución reducido para
gget info
ygget seq
Versión ≥ 0.3.11 (7 de septiembre de 2022):
- Nuevo módulo:
gget pdb
Versión ≥ 0.3.10 (2 de septiembre de 2022):
gget alphafold
ahora también devuelve valores pLDDT para generar gráficos sin volver a ejecutar el programa (consulte también las preguntas frecuentes de gget alphafold)
Versión ≥ 0.3.9 (25 de agosto de 2022):
- Instrucciones de instalación de openmm actualizadas para
gget alphafold
Versión ≥ 0.3.8 (12 de agosto de 2022):
- Se corrigieron los requisitos de versión de mysql-connector-python
Versión ≥ 0.3.7 (9 de agosto de 2022):
- NOTA: El sitio FTP de Ensembl cambió su estructura el 8 de agosto de 2022. Actualice a la versión
gget
≥ 0.3.7 si usaobtener ref
Versión ≥ 0.3.5 (6 de agosto de 2022):
- Nuevo módulo:
gget alphafold
Versión ≥ 0.2.6 (7 de julio de 2022):
- ¡
gget ref
ahora admite genomas de plantas! 🌱
Versión ≥ 0.2.5 (30 de junio de 2022):
- NOTA: UniProt cambió la estructura de su API el 28 de junio de 2022. Actualice a la versión
gget
≥ 0.2.5 si usa alguno de los módulos que consultan datos de UniProt (gget info
ygget seq
).
Versión ≥ 0.2.3: (26 de junio de 2022):
- JSON ahora es el formato de regreso predeterminado para la Terminal para los módulos que anteriormente devolvían el formato de data frame (CSV) (el formato se puede convertir a data frame/CSV usando la bandera
[-csv][--csv]
). El formato data frame/CSV sigue siendo el formato de regreso predeterminada para Python (Jupyter Lab/Google Colab) (y se puede convertir a JSON conjson=True
). - Para todos los módulos, el primer parámetro requerido se convirtió en un parámetro posicional y ya no debe nombrarse en la línea de comandos, p. ej.
gget ref -s human
→gget ref human
. gget info
:[--expand]
está en desuso. El módulo ahora siempre devolverá toda la información disponible.- Ligeros cambios en la salida devuelta por
gget info
, incluida la devolución de los ID de Ensembl versionados. gget info
ygget seq
ahora son compatibles con las IDs de WormBase y FlyBase.- Ahora también se pueden ingresar IDs de tipo Ensembl a
gget archs4
ygget enrichr
con la bandera[-e][--ensembl]
(ensembl=True
para Python (Jupyter Lab / Google Colab)). - El parámetro
seqtype
degget seq
fue reemplazado por la bandera[-t][--translate]
(translate=True/False
para Python (Jupyter Lab / Google Colab)) que devolverá secuencias de nucleótidos (False
) o aminoácidos (True
). - El parámetro
seqtype
degget search
se renombró aid_type
(aún tomando los mismos parámetros 'gene' o 'transcript').