Gene Dole_2186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2186
Symbol
ID	5695032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2654753
End bp	2655943
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	60%
IMG OID	641264790
Product	peptidase M24
Protein accession	YP_001530067
Protein GI	158522197
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0133424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAG ATATTCAGGA AACCTACACG CCCCGGTCGG AAATTGATGC CCGTCTGAAA 
CGGCTGCGCA ACAGGCTTGA AAAGGAAAAA ATCGACGCTG CCCTGATTAT GGAGACTGCC 
GACCTCTTTT ACTTTTCCGG CACGGCCCAG CAGGCGTTTC TGCATGTCCC GACAGACGGC 
CCGGCCATTC TGATGGTCAA GAAAGACGCC CAGCGGGCCT TTGAAGAGTC TTCCATCGAG 
CAGATCCGCG CCCTGCGCAG CCAGAAGGAG ATGGCGCCCG TCATCGGTTC GCCAAAGACC 
CTGGGCATGG AGCTGGATGT GCTGCCGGTC AACATGTACC GCTATTTTCA GGAACAGTTT 
CCGGATACAG AAATTGTGGA CATATCCCAT GCCGTGCGGT CGCTAAGGGC CGTAAAATCA 
GCTTATGAAA TTGATATCAT CCGGCAGGCA TCAAGGCTTT CCGACCAGCT GGCCGCCTTT 
GTGCCCCGGG TGCTGGAGCC GGGTATGCCC GAGATTGAAC TGGCCGGCCT GATTGAGGCC 
GAAGCCAGAA GGCTCGGCCA CCAGGGCATG ATTCGCATGC GGGGCTGGAA CAGCTCACTC 
TTTTATGGCC ACATCATGGG CGGAGCCTCC GCGGCGGTTT CCAGCAGCCT GGCCTCGCCC 
ACCGGCGGCG TAGGCACCAC ACCGGTGTTT CCCCAGGGCA GCAGCTTTGC CCCCATCCGG 
TCCGGTGAGC CGGTGCTCAT GGACATGGCC TTCGGCTTTC GGGGCTACCT GTCCGACCAC 
ACGCGGATCT ACGCCATTGG CAGCCTGGCC GATGACCTGC TGGCAGCCCA TGATGCCATG 
CTGGAGATTC AGGAACTGGT CAAAAATACG GCCCGGCCCG GCATGACCGC GGGCTCGGTG 
TACGAACTGG CTGCCGAGCG GGTGGCTGAG CTTGGATATG CCGATAATTT TATGGGCGCA 
GGTGACGGTC GGGTCCCTTT CGTGGGTCAC GGCGTCGGCA TTGAACTGGA CGAATACCCG 
GTGCTGGCCC GGGGGCAGAA AATGGTGCTG GAAGAGGGCA TGGTGGTGGC GGTGGAGCCC 
AAGGCCATTT TCCCGGGCCG GGGCGTGGTG GGTATTGAAA ACACCCATAT CGTGACAAAA 
AACGGCCTGG AACAGCTGGG TCGCTATCCC GAGGCCGTGG TAATCGTCTG A

Protein sequence

MATDIQETYT PRSEIDARLK RLRNRLEKEK IDAALIMETA DLFYFSGTAQ QAFLHVPTDG 
PAILMVKKDA QRAFEESSIE QIRALRSQKE MAPVIGSPKT LGMELDVLPV NMYRYFQEQF 
PDTEIVDISH AVRSLRAVKS AYEIDIIRQA SRLSDQLAAF VPRVLEPGMP EIELAGLIEA 
EARRLGHQGM IRMRGWNSSL FYGHIMGGAS AAVSSSLASP TGGVGTTPVF PQGSSFAPIR 
SGEPVLMDMA FGFRGYLSDH TRIYAIGSLA DDLLAAHDAM LEIQELVKNT ARPGMTAGSV 
YELAAERVAE LGYADNFMGA GDGRVPFVGH GVGIELDEYP VLARGQKMVL EEGMVVAVEP 
KAIFPGRGVV GIENTHIVTK NGLEQLGRYP EAVVIV