蛋白结晶条件预测

利用PDB数据库进行蛋白结晶条件预测

整理生物实验使用的产品的特有属性

整理生物实验使用的产品的特有属性 [Deepbiogroup (opens new window)]

研究人员主页信息提取

利用chatgpt的api获取相关信息作为训练数据

判断页面是否是研究人员的主页

从主页中提取研究人员的名称

提取联系方式、职称等信息

文献中使用产品的识别

从Pubmed Baseline 和update files 获取文献信息

从PMC、期刊html获取文献全文信息,解析出标题的段落

从生物实验常用产品的网页中提取名称、规格、货号等信息

从文献中提取产品信息

单细胞转录组流程开发

数据预处理:cellranger count、summary

细胞分群、注释 seurat,StringR

细胞通讯iTalk,trajectory analysis,infercnv等

常规转录组分析流程升级

升级常规转录组分析流程,改进数据预处理、表达定量、差异表达分析和功能富集分析等模块,提高数据处理的效率和准确性

开发DNA序列优化工具

https://github.com/HealthCodon/dnachisel_dtailor_mode

基于天然的物种基因序列和蛋白表达量,用物种密码子使用频率和GC含量等特征预测高表达蛋白的DNA序列。用来优化蛋白质表达所用到的模板DNA。