Gene Dtox_2163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2163
Symbol
ID	8429146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	2333548
End bp	2334741
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	38%
IMG OID	645034479
Product	peptidase M24
Protein accession	YP_003191609
Protein GI	258515387
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000118517
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0215342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAC AAATACCGTT AAGCGAACTT GAGAGACGTA TTAACTCTTT AAGAACCAAA 
ATGGAGAAAT TATGTCCTGA CTGGGAAATG ATTGCTATTT TTAGTAACAT CAACTTATAT 
TATTTCACCG GAACCGTACA AGATGGTATG TTGCTTATAC CCCGAAACGA TGATGCAGTA 
TTCTGGGTAA GACGCAGTTA TGAACGAGCT TTGGATGAAT CGTTATTTAC AAGGATTAAA 
CCAATGACTA GTTACCGTGA GGCAGCAGCA TCTATGAAAA AATTTCCTGA AACAGTTTAC 
ATGGAAACTG AGATAGTACC GCTGGCGTTA TACCAGCGCT TTCAGAAGTA CTTCCCTTTT 
ACTCATGTGA AATCAGTTGA TAAATATATA GCCGGGGTAA GAGCAATTAA GAGCAGTTTT 
GAACTTTCAT TGATGGTACA GGCTGGTTCA ATTCACCAGA GGACACTGGA ACAATATGTA 
CCACAACTGT TGAAAGAAGG TATCAGTGAA GTAGATTTAG CAACCGAATT ATATTCTATT 
ATGGTAACTG AAGGACATCA CGGAGTTGCA CGCTTTGGTG CATTTGGCGC AGAGATAGTA 
TTAGGGCTTG TATGTTTTGG TGATAGTTCT ATCTATCCAA CATATTTTGA TGTGCCGGGA 
GGTAATTACG GTTCGTGCCC TGCGGTACCA TTACTAGGCA ATCGTTATCG CAAGCTTAAG 
AAAGGTGATC TAGTTTTTAT TGATATAGGT TGTGGAGTAA GCGGTTATCA TACTGATAAA 
ACCATGACTT ATATGTTTGG CAAATCGCTG TCACAAGAAG CGATTTCTGC ACATAAGCAG 
TGTGTCGATA TACAAAATAG AATTGCTGAG ATGCTAAAAC CGGGTGCTGT TCCGGCACAA 
ATATATAAAA ATACAATAAA CAATCTTAGT CCTGAGTTTC TCGAAAATTT TATGGGTTAC 
GGGAATCGCA GGTCCAAATT TTTGGGACAT GGGATAGGTT TATTAATTGA TGAATTGCCT 
GTGATAGCAG AAGGGTTTAC TGAGCCGATA GAAGAAGGAA TGGTTTTTGC AATTGAACCT 
AAAAAGGGTA TTAAAAATAT TGGTATGGTT GGAACTGAAA ACACTTTTAT AGTTACTCCT 
AACGGTGGAC TTTGTATTAC CGGAGATAAT CCGGGATTAA TTCCTGTGTA TTGA

Protein sequence

MKKQIPLSEL ERRINSLRTK MEKLCPDWEM IAIFSNINLY YFTGTVQDGM LLIPRNDDAV 
FWVRRSYERA LDESLFTRIK PMTSYREAAA SMKKFPETVY METEIVPLAL YQRFQKYFPF 
THVKSVDKYI AGVRAIKSSF ELSLMVQAGS IHQRTLEQYV PQLLKEGISE VDLATELYSI 
MVTEGHHGVA RFGAFGAEIV LGLVCFGDSS IYPTYFDVPG GNYGSCPAVP LLGNRYRKLK 
KGDLVFIDIG CGVSGYHTDK TMTYMFGKSL SQEAISAHKQ CVDIQNRIAE MLKPGAVPAQ 
IYKNTINNLS PEFLENFMGY GNRRSKFLGH GIGLLIDELP VIAEGFTEPI EEGMVFAIEP 
KKGIKNIGMV GTENTFIVTP NGGLCITGDN PGLIPVY