Gene Dole_2972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2972
Symbol
ID	5695831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3564153
End bp	3565496
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	62%
IMG OID	641265588
Product	peptidase M48 Ste24p
Protein accession	YP_001530852
Protein GI	158522982
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.297503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACCC ACATCCCTGC GCCCCGACAG ACCCTCAGCC GACGGGAGTT CCTGCAGATG 
TCGGCCCTGG CTTCGGCCGG CCTGATTCTC GGGTGCGCCA TCAACCCGGT AACCGGTGAA 
AAACAGCTCA TGCTGGTGTC CGAGGAGTGG GAGGTCCAGG TGGACCGGCA GAACGCGCCC 
CACCAGTTTT CCGCCGACTA CGGAACCATT CAGGACCAGG CGGTAAACCG CTATGTTCAG 
CAGGTCGGCG CAAACCTGGT GAAAAACACG CACCGGCCCC AGATGCCCTA CTCCTTCCGG 
TGCGTCAATG CCACCTACAT CAATGCCTAC GCCTTTCCCG GCGGCAGCAT CGCCGCCACC 
CGGGGCATTC TGCTCTCCCT GGAAAGCGAG GCCGAACTGG CCGCGCTGAT GGGCCATGAG 
CTGGGCCATG TCAATGCCCG GCACACGGCT CAGCAGATGT CCAAGGGCAT GGTGACCCAA 
ACCCTGGTGG GCGGGGTCAG CGCGTACATC GGCACCCATG GCACGGCCTT CGGCACTGTG 
GCCGAACAGC TCGGCATGCT GGGCGCCGGC GCGCTTCTGG CCGGATACAG CCGCGACAAT 
GAACGGGAGG CCGACCACCT GGGTCTGGCC TACATGACCC AAAGCGGATA CGGCACCGAC 
GGCATGGTCG GTCTCATGGC CATGCTCAAT TCCCTTCACA AGGGCGGCAC CGACGCGGTC 
TCCCTGCTGT TTTCCACCCA CCCCATGAGC CAGGAGCGAT ACGATACAGC CGTGGCCGAG 
GCCGGCGCCG AATTTGCCGC CGCCAAAAGC CTGCCCGTTC ACCGGGAGCG ATACATGGAC 
AGCACCGCGT CTTTACGCAA AATAAAACCG GCCATTGAGC TGTTTCAAAA AGGAGAAGCC 
GCCATGGCCA GGGAAAATTT TGATGCCGCT GAAACCGCGC TGCAGCAGGG CCTGAAGCTT 
GCCCCGGCCG ACTATGCCGG CCTTGTGATC ATGGCCAAAT GCCGGCTCTC CCAGGGAAAA 
TACGCAGAAG CCCTGCGCTT TTCGGAAACC GCGGGACAGG TCTATCCCCA GGAGGCCCAG 
GCCAGCCACC TGAGCGGTTT TGCCAGAATC AAGCTGAAAC AGTTTGAGGG GGCGGTTGCC 
AATTTTACCG CCTATGAGAA AAAGCTGCCC GGCAACCCCA ACACCGCTTT TTACAGGGGC 
TATGCCTACG AAGGGATGAA CAACAGGCAG AAGGCCGCCG CCGATTACGT GGCCTATCTC 
AAACAGGTCA ACCAGGGGGA CCAGGCCCGG TACGCCTACA ACCGCCTGGT GGAGTGGGGG 
GTTGTCAAAC CGGCCGGCCA GTGA

Protein sequence

MKTHIPAPRQ TLSRREFLQM SALASAGLIL GCAINPVTGE KQLMLVSEEW EVQVDRQNAP 
HQFSADYGTI QDQAVNRYVQ QVGANLVKNT HRPQMPYSFR CVNATYINAY AFPGGSIAAT 
RGILLSLESE AELAALMGHE LGHVNARHTA QQMSKGMVTQ TLVGGVSAYI GTHGTAFGTV 
AEQLGMLGAG ALLAGYSRDN EREADHLGLA YMTQSGYGTD GMVGLMAMLN SLHKGGTDAV 
SLLFSTHPMS QERYDTAVAE AGAEFAAAKS LPVHRERYMD STASLRKIKP AIELFQKGEA 
AMARENFDAA ETALQQGLKL APADYAGLVI MAKCRLSQGK YAEALRFSET AGQVYPQEAQ 
ASHLSGFARI KLKQFEGAVA NFTAYEKKLP GNPNTAFYRG YAYEGMNNRQ KAAADYVAYL 
KQVNQGDQAR YAYNRLVEWG VVKPAGQ