-
-
-
今日一坑
在tair下载的gff文件中,竟然有一行的染色体名称为OBChr1,有且仅有此一行。
导致我在使用gffread提取cds时报错= =,手动修改后就好了
https://www.arabidopsis.org/download_files/Public_Data_Releases/TAIR_Data_20220630/Araport11_GFF3_genes_transposons.Jul2022.gff.gz
-
homer的两个主要命令:findMotifsGenome.pl和findMotifs.pl。前者可以直接导入macs2的summit文件,后者适合找一些启动子共有的motif。
另外还有scanMotifGenomeWide.pl和seq2profile.pl,用来创建motif文件和搜索motif。
学习之前学过的东西真是一个痛苦的事情。
-
-
-
-
今日一坑:rapdb下载的注释文件“IRGSP-1.0_representative_annotation_2023-09-07.tsv”中基因列会有重复,如Os02g0616600,因为这个注释文件对每个基因的每个转录本都会有一行注释。
有趣的是,以这一列为索引提取hdf5数据时会只提取到第一个转录本。另外,在”RAP-MSU_2023-09-07.txt“这个基因id转换的文件里,还会有以下情况出现,LOC_Os12g08564.1&LOC_Os12g08564.2&LOC_Os12g08564.4都会转换到Os12g0186600,但LOC_Os12g08564.2会转换到none
(摊手)
-
-