Gene Dole_2898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2898
Symbol
ID	5695756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3483494
End bp	3484780
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	53%
IMG OID	641265513
Product	peptidase C14 caspase catalytic subunit p20
Protein accession	YP_001530778
Protein GI	158522908
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.180767
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA CTATCACATT CATTTTAATC GTTGCACTGT TCTTGGTCCT GCCGTCATGC 
GCCACGCTCA CCCAGCTGGG GAAGGCGGCA AGGAGCGGAG ATATCAGACA GGTAGAAACG 
CTTTTAAAAA ACGGCGCCGA TGTGAATGAA ACGGCGTTGA TGGGCGTAAC ACCTCTGTAT 
GAAGCGGTTT TATATGATGC CCCCATAGAG ATAGTAAGGC TTCTGCTTGA TAACGGCGCC 
GACGTCAACA GAGGGATGGG GAATGGATGG AAGCCTATAC ATCTGGCGGT TGATAACGGC 
AATGCCGCTG TAGTCAAGCT TCTGATTGAC CGGGGGGCAG ATGTCTCTTT TCAGAATCCC 
CATGGCAAAA CCCCGTTACA AATGGCCCAG GAAAACGGCC AGGCCGTTAT GCTTCGCCTG 
CTTCAGGATG CAGAGGAGAA GCAGTATAAA GCACTTTTTG CAAAATCTGA TATAGAGGCC 
CGACCTTCGA TCGACGGCGG CTCCGTTTCG ATTCTCAAAT CAGACGTCGA TGACCCTCCT 
TCCATTCATT CAAAGAACAA CCACAGCGCT TATGCCATCG TCGTCGGCAT TGAAAGTTAT 
CGTCAGCAAC TTCCCAAGGC AGATTTTGCC GCCCGGGACG CGCAGACAAT GACCAGTTAT 
TTGACAAAAG CCATGGGGTA TCCTGAAGAA AACGTGGTGA CGCTTTTAAA CGACCGGGCG 
GCGAAAAGTG ATTTTGAAAA ATATTTTGAA AAATGGCTGT CCAACAACGT GGAGACGGGC 
AGTACGGTTT TTGTCTATTT TTCCGGCCAT GGCGCGCCCG ACCCCAAAAC CGGTTCTGCC 
TACCTGGTGC CCTATGACGG AGACCCTACA TTTATCGCTG AGACCGGCTA CTCGTTAAGC 
AGAATGTATA CCGCCCTGGG CAAACTTCCG GCAAAGGAGA TCATCGTTGC CCTGGACTCC 
TGCTTTTCCG GCGCCGGTGG CCGGTCGGTG CTGGCCAAAG GGGCCCGGCC CCTGGTGATG 
AACCTTCAGA CCGGAACAGC CATATCAAAA AACATGACCG TGATTGCCGC TTCAGCGGGC 
GACCAGATCA GCTCCACCTA TGACGAAAAG GGCCACGGCC TGTTCACCTA CTTTCTGCTC 
AAAGGCATCA AGAACGAGGA TGTGCTCAAC CCGGACGGCT CCCTTCGCAT GGACGACCTG 
TTCGGCTACA TCTCGCCTCA GGTGGAGCGC ATTGCGCGCA AACAATACAA CAACGAACAG 
ACACCGCAGC TGATCGGGGC GAAGTAG

Protein sequence

MKKTITFILI VALFLVLPSC ATLTQLGKAA RSGDIRQVET LLKNGADVNE TALMGVTPLY 
EAVLYDAPIE IVRLLLDNGA DVNRGMGNGW KPIHLAVDNG NAAVVKLLID RGADVSFQNP 
HGKTPLQMAQ ENGQAVMLRL LQDAEEKQYK ALFAKSDIEA RPSIDGGSVS ILKSDVDDPP 
SIHSKNNHSA YAIVVGIESY RQQLPKADFA ARDAQTMTSY LTKAMGYPEE NVVTLLNDRA 
AKSDFEKYFE KWLSNNVETG STVFVYFSGH GAPDPKTGSA YLVPYDGDPT FIAETGYSLS 
RMYTALGKLP AKEIIVALDS CFSGAGGRSV LAKGARPLVM NLQTGTAISK NMTVIAASAG 
DQISSTYDEK GHGLFTYFLL KGIKNEDVLN PDGSLRMDDL FGYISPQVER IARKQYNNEQ 
TPQLIGAK