Gene Dole_1673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1673
Symbol
ID	5694510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1990000
End bp	1991145
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	61%
IMG OID	641264268
Product	peptidase M24
Protein accession	YP_001529554
Protein GI	158521684
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0480617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGAA ACGTTTTGGA TGATTTGATA CGAGAAAGAA TCCAGCGGGT GAGAAGACAT 
CTGGCCGGCC TGGAATCCGA CACCCTTCTG GTGCTCTCCG ATGAGAACCG GTTTTATTTG 
AGCGGTTTTT CCGGCCTTGA CGGCGGATAC AATGAATCGG CCGGGGTGCT GTTGATCACA 
AACGACCGGC TGGTCCTGGC CACGGACGGC CGTTACAACG TGCAGGCGGA AACCGAGGCC 
CCTCTGTACG AGGTGGTCTG TTACCCCGCG GGCCTGGCCC GGATTCTGCC GGACCTGCTG 
GCCGATCTGG GCACCCGGCA CATGGGATTT GAGGCCGGCC GCATGCCCCA CGCCGATTAT 
CTTCGCATAT CAAAAGCCCT TGAAGAAAAA GGGCTGAAGG TTTCTTTTAC GGATGCGGCC 
CCGGTGCTGG ACCGGCTGCG CGTTCAAAAG GAGCCTTTCG AAATCGACGC CATCCGCCGG 
GCCCTGGCAT TTGCGGAAAA CGCCTTTGAA CTGTTTGTCA GTTATGACCT TGCGCCGGGC 
ATGACCGAAA AAGAGGCGGC CTGGGTCCTG GAGCGGCGCA TGCGCGAGAT GGGGGCTGAT 
GGCCTGTCGT TTTCTATTAT TGCAGCCTTT GGTGAAAACA GCGCGCTGCC CCACGCGGTG 
TGCGGGGACC GGGTCGCGCA ACCCGGCATG CCCCTGCTGT TTGACTGGGG GGCCAGGGCA 
GGGGGGTACT GTTCAGACAC CACCCGCAGC TTTGTTCTGG CAAAGGCCGA TTCGGATTAC 
CGCAAGGTCC ATCAGGCGGT TTACGACGCC CACATGAAGG CCGTGGAAGC CATACAGCCG 
GGTGTCAGCG CAAAAGCGGT GGATGCCGCG GCAAGGGACC ATATCGACCG GGCCGGGTTT 
GGCGGAAAGT TTTCCCACGG CCTGGGCCAT GGCGTTGGCC TGGCCATTCA TGAACCGCCC 
CGGGTCAGCG CCCAGAGTGA GGATGTGCTG GAAGAGGGCA TGGTGGTCAC GGTGGAGCCG 
GGTATTTATC TTCCCGGCTG GGGCGGGGTG CGGCTGGAAA ACATGGCGGT GGTCCGGTCC 
CACGGCGCCG AATTGCTCAA CCGGCTTCCC CTTACCCACA CGGAGCCCGG GGGGCAGCCT 
TCATGA

Protein sequence

MKGNVLDDLI RERIQRVRRH LAGLESDTLL VLSDENRFYL SGFSGLDGGY NESAGVLLIT 
NDRLVLATDG RYNVQAETEA PLYEVVCYPA GLARILPDLL ADLGTRHMGF EAGRMPHADY 
LRISKALEEK GLKVSFTDAA PVLDRLRVQK EPFEIDAIRR ALAFAENAFE LFVSYDLAPG 
MTEKEAAWVL ERRMREMGAD GLSFSIIAAF GENSALPHAV CGDRVAQPGM PLLFDWGARA 
GGYCSDTTRS FVLAKADSDY RKVHQAVYDA HMKAVEAIQP GVSAKAVDAA ARDHIDRAGF 
GGKFSHGLGH GVGLAIHEPP RVSAQSEDVL EEGMVVTVEP GIYLPGWGGV RLENMAVVRS 
HGAELLNRLP LTHTEPGGQP S