• @caigui caigui December 07 2023

    一个拟南芥注释好不好用的小测试:

    1.看AT1G26340,AT1G06960,AT1G26240的注释和TAIR能否对的上

    2.看AT2G17950的注释是否同时有PGA6和WUS的名字

    3.看AT1G09090的Curator_summary是否正常显示

    读入gene_aliases_20220630.txt.gz文件就是个技术活,各种字符在里面捣乱

    使用read.table读入时,一定要加上comment.char="",否则连读都读不进去。

    如果使用readr::read_table直接读取进来,不仔细检查的话,就会漏掉上面的问题。

    最终输出整合好的注释时,也要注意对Curator_summary列使用iconv进行转换, 如下,否则在shiny使用时就会报错!

    mutate(Curator_summary = iconv(Curator_summary, "UTF-8", "ASCII//TRANSLIT", sub = ""))。

    拟南芥啊,做的人多,注释中存在的问题也就多,得多多注意!

  • @caigui caigui December 05 2023

    一些公众号的名字真是让人头大,比如319Library,比如Cemps研究声。想找的时候老是想不起来该搜什么

  • @caigui caigui December 04 2023

    TAIR上下载的ara11的最新注释的gff3版本,在gffread转为gtf格式时报错,没有仔细看为什么报错了。换成同个地址提供的gtf好一些了,但是此时gtfToGenePred需要添加-ignoreGroupsWithoutExons参数否则报错。

    八成是ara11的gff3有问题,jgi13上下载的gff3都很好用= =

  • @caigui caigui December 04 2023
  • @caigui caigui November 24 2023

    RIdeogram,一个画染色体组型的R包

  • @caigui caigui November 22 2023

    今日一坑

    在tair下载的gff文件中,竟然有一行的染色体名称为OBChr1,有且仅有此一行。

    导致我在使用gffread提取cds时报错= =,手动修改后就好了

    https://www.arabidopsis.org/download_files/Public_Data_Releases/TAIR_Data_20220630/Araport11_GFF3_genes_transposons.Jul2022.gff.gz

  • @caigui caigui November 21 2023

    homer的两个主要命令:findMotifsGenome.pl和findMotifs.pl。前者可以直接导入macs2的summit文件,后者适合找一些启动子共有的motif。

    另外还有scanMotifGenomeWide.pl和seq2profile.pl,用来创建motif文件和搜索motif。

    学习之前学过的东西真是一个痛苦的事情。

  • @caigui caigui November 20 2023

    用默认的gitbook有以下几个问题:
    分享功能国内环境不适用,搜索功能用不了中文,不过问题不大

  • @caigui caigui November 15 2023

    下载一个ncbi的nt数据库,310G。aspera下载4G左右就报错(Session Stop (Error: Session data transfer timeout)),难以解决。换为wget,下载速度降低30%,但稳定多了,总共需要下载2d6h。
    第二天的更新,nt数据库已经下载了85%,264G了,很稳定,不错不错👍

  • @caigui caigui November 14 2023

    今日一坑,偶然发现本网站的“瞬间”页面打不开了,通过升级“瞬间”插件从v1.0.1到v1.3.0解决。突然意识到,之前备份只备份了文章,没有对“瞬间”页面中的内容进行备份,需要研究研究……