甲基化+组蛋白测序heatmap+profile绘制

griedzx 发布于 2023-10-20 收录于表观组学

使用deeptools的 computeMatrix + (plotHeatmap or plotProfile)可以针对某些特定类型的区域如TTS、TES的指定区域范围进行信号富集程度的可视化 computeMatrix’s parameters

TF-IDF

griedzx 发布于 2023-10-18 收录于生物文本挖掘

TF-IDF简要介绍 TF-IDF(term frequency–inverse document frequency)，一种常用于挖掘文章中关键词的加权技术。某个词在文章（一篇文章

PubTator

griedzx 发布于 2023-10-17 收录于生物文本挖掘

API调用 1 2 3 4 5 6 7 8 9 10 11 12 13 #! /bin/bash id_list='/home/yh/dzx/work/BioNLP/EntityAnnotation/pmid.txt' #读取id时跳过pmid.txt第一行列名 while read line do if [ $line != 'pmid' ] then curl https://www.ncbi.nlm.nih.gov/research/pubtator-api/publications/export/pubtator?pmids=$line >> /home/yh/dzx/work/BioNLP/EntityAnnotation/abstract_pubtator.txt echo >> /home/yh/dzx/work/BioNLP/EntityAnnotation/abstract_pubtator.txt fi sleep 2 done < $id_list 1 cat abstract_pubtator.txt|grep -v

R包peak注释

griedzx 发布于 2023-10-08 收录于处理和分析高通量测序数据

利用ChIPseeker R包对peak进行注释经过前期的处理拿到了BED文件，利用这些文件和ChIPSeeker可以进一步对peak注释、可

ATAC-Seq数据处理

griedzx 发布于 2023-10-07 收录于处理和分析高通量测序数据

ATAC-seq数据peak calling fastq数据trim_galore软件质控对双端测序的左右端结果文件进行处理 1 2 $ pwd /home/yuanhx/dzx/ATAC_seq/clean 1 2 3 4 5 6 #shel

perl中正则表达式

griedzx 发布于 2023-09-19 收录于 Perl

运用实例 1 2 3 4 5 6 7 8 9 10 11 12 =pod 下列是一条蛋白质序列，请统计该序列长度、丙氨酸（A）的个数及所占的比例； MNAPERQPQPDGGDAPGHEPGGSPQDELDFSILFDYEYLNPNEEEPNAHKVASPPSGPAYPDDVLDYGLKPYSPLASLSGEPPGRFGEPDRVGPQKFLSAAKPAGASGLSPRIEITPSHELIQAVGPLRMRDAGLLVEQPPLAGVAASPRFTLPVPGFEGYREPLCLSPASSGSSASFISDTFSPYTSPCVSPNNGGPDDLCPQFQNIPAHYSPRTSPIMSPRTSLAEDSCLGRHSPVPRPASRSSSPGAKRRHSCAEALVALPPGASPQRSRSPSPQPSSHVAPQDHGSPAGYPPVAGSAVIMDALNSLATDSPCGIPPKMWKTSP =cut $protein_sequence = "MNAPERQPQPDGGDAPGHEPGGSPQDELDFSILFDYEYLNPNEEEPNAHKVASPPSGPAYPDDVLDYGLKPYSPLASLSGEPPGRFGEPDRVGPQKFLSAAKPAGASGLSPRIEITPSHELIQAVGPLRMRDAGLLVEQPPLAGVAASPRFTLPVPGFEGYREPLCLSPASSGSSASFISDTFSPYTSPCVSPNNGGPDDLCPQFQNIPAHYSPRTSPIMSPRTSLAEDSCLGRHSPVPRPASRSSSPGAKRRHSCAEALVALPPGASPQRSRSPSPQPSSHVAPQDHGSPAGYPPVAGSAVIMDALNSLATDSPCGIPPKMWKTSP"; $len = length($protein_sequence); $A_count = $protein_sequence =~ s/A/A/g; $A_per = ($A_count/$len)*100; print