Gene Dtox_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0201
Symbol
ID	8427125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	219699
End bp	220661
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	43%
IMG OID	645032588
Product	4-diphosphocytidyl-2C-methyl-D-erythritolkinase
Protein accession	YP_003189777
Protein GI	258513555
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.114439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTGG TTATACCCGC TTATGCTAAA ATCAATCTTT GTTTGGATGT GCTGGGAAGA 
AGGGATGACG GTTATCATGA GGTAGAGATG GTTATGCAAT CTATTTCTCT GCATGATTTG 
CTGGAGCTGT CCCTCTCGGA AGAGCAGGAA AATAATAATA TGGGCAAGAT TATTTTGACT 
GTTGCAGGTG CTGATTTGCC TGTTGGTGAG GAGAATCTGG TATTCAGGAC GGCCCGCATA 
TTGCAGGAGT ATACGGGATG CCGGTTGGGC TGCTCAATAC TTCTGCATAA AAAGATACCG 
GTTGCTGCCG GTCTTGCCGG TGGGTCCGCT GATGCTGCTG CGGCACTGCT GGGTCTTAAT 
AAGTTATGGA ATTTGGATTT AACTGTTGCA GAACTGTATG CTTTAGCAGC TAAAATTGGT 
TCTGATGTAC CTTTTTGTAT CAAAGGCGGT ACAGTGCTGG CAAAAGGAAG AGGCGAGCAG 
TTGGCTTTTC TGGAAGCCGC ACCCGATATG GGAATTATTT TAGTTAAACC TGCTTATGGA 
ATATCTACCG GGGAGGTTTA TAGCAAGCTG AATAGCGCCG TTTATCCTCA AGTTATTAAT 
ACGATGCAAA AAAAAGATAT TACTAATGAT ACTAATGATA TCCATAACAT GTTATGCCTT 
TCGGATTTGG GACCGCCGGT ACTAAGAATG ATTAAAGCCA TAAAAAGCAG GCAATTGCCT 
GCTGTATGTA AGGCTTTATA TAATATTTTG GAGGAACCGG CAATGAAAAT GCACCCGAAC 
CTTTTAGATA TAAAAAACAT ACTATTTGAA CAAGGAGCGA TGGGTGTTTT AATGTCCGGC 
AGCGGATCGA CAATTTTTGG CATCACTCCT GATTTAGAGG CCGCACATCT GCTGTCTAAG 
GGCCTGAGTC CTTCGCTTGG ATCTATTTAT GCGGTGAAAT TGCAGGGAGC GAGAGAAGTA 
TGA

Protein sequence

MPLVIPAYAK INLCLDVLGR RDDGYHEVEM VMQSISLHDL LELSLSEEQE NNNMGKIILT 
VAGADLPVGE ENLVFRTARI LQEYTGCRLG CSILLHKKIP VAAGLAGGSA DAAAALLGLN 
KLWNLDLTVA ELYALAAKIG SDVPFCIKGG TVLAKGRGEQ LAFLEAAPDM GIILVKPAYG 
ISTGEVYSKL NSAVYPQVIN TMQKKDITND TNDIHNMLCL SDLGPPVLRM IKAIKSRQLP 
AVCKALYNIL EEPAMKMHPN LLDIKNILFE QGAMGVLMSG SGSTIFGITP DLEAAHLLSK 
GLSPSLGSIY AVKLQGAREV