• @caigui caigui November 22 2023

    今日一坑

    在tair下载的gff文件中,竟然有一行的染色体名称为OBChr1,有且仅有此一行。

    导致我在使用gffread提取cds时报错= =,手动修改后就好了

    https://www.arabidopsis.org/download_files/Public_Data_Releases/TAIR_Data_20220630/Araport11_GFF3_genes_transposons.Jul2022.gff.gz

    0 0
  • @caigui caigui November 21 2023

    homer的两个主要命令:findMotifsGenome.pl和findMotifs.pl。前者可以直接导入macs2的summit文件,后者适合找一些启动子共有的motif。

    另外还有scanMotifGenomeWide.pl和seq2profile.pl,用来创建motif文件和搜索motif。

    学习之前学过的东西真是一个痛苦的事情。

    0 0
  • @caigui caigui November 20 2023

    用默认的gitbook有以下几个问题:
    分享功能国内环境不适用,搜索功能用不了中文,不过问题不大

    0 0
  • @caigui caigui November 15 2023

    下载一个ncbi的nt数据库,310G。aspera下载4G左右就报错(Session Stop (Error: Session data transfer timeout)),难以解决。换为wget,下载速度降低30%,但稳定多了,总共需要下载2d6h。
    第二天的更新,nt数据库已经下载了85%,264G了,很稳定,不错不错👍

    0 0
  • @caigui caigui November 14 2023

    今日一坑,偶然发现本网站的“瞬间”页面打不开了,通过升级“瞬间”插件从v1.0.1到v1.3.0解决。突然意识到,之前备份只备份了文章,没有对“瞬间”页面中的内容进行备份,需要研究研究……

    0 0
  • @caigui caigui November 14 2023

    今日一坑:rapdb下载的注释文件“IRGSP-1.0_representative_annotation_2023-09-07.tsv”中基因列会有重复,如Os02g0616600,因为这个注释文件对每个基因的每个转录本都会有一行注释。
    有趣的是,以这一列为索引提取hdf5数据时会只提取到第一个转录本。

    另外,在”RAP-MSU_2023-09-07.txt“这个基因id转换的文件里,还会有以下情况出现,LOC_Os12g08564.1&LOC_Os12g08564.2&LOC_Os12g08564.4都会转换到Os12g0186600,但LOC_Os12g08564.2会转换到none

    (摊手)

    0 0
  • @caigui caigui November 13 2023

    halo占用内存500多M,对于我这只有两个G的小服务器来说,压力还是挺大的

    0 0
  • @caigui caigui November 10 2023

    今天一个新坑,linux中一个文件在被写入时,如果cp它的话,可能会导致最后一段是二进制的,在后续读取时会报错

    0 0
  • @caigui caigui November 10 2023

    如果写一本生信书,第一章应该讲清好处与坏处,先随便写写吧

    做生信的坏处:
    1. 视力下降,肥胖,高血脂,痔疮

    1. 2. 自费购买高性能电脑、云服务器、学习资料、科学上网软件

    2. 3. 工作也不好找,技术淘汰快,半年前的代码,现在可能已经过时了

    3. 4. 要学习的东西太多,时间不够用

    4. 5. 当一堆人的数据分析助理

    做生信的好处:

    1.时间灵活

    1. 2.工作虽然仍不好找,但可能比同专业的好找一些

    2. 3.挂名文章会多一些

    3. 4.比较前沿

    0 0
  • @caigui caigui November 10 2023

    顺带记录另一个bug修复:

    给shiny的downloadHandler返回一个datatable对象时,会导致下载文件不能按预期进行,而是下载一个html文件。将返回对象改为data.frame即可。

    解决方法:大量搜索+连蒙带猜+多多尝试

    0 0