Gene Dtox_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2042
Symbol
ID	8429024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	2221849
End bp	2222970
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	37%
IMG OID	645034363
Product	Thiamin pyrophosphokinase catalytic region
Protein accession	YP_003191494
Protein GI	258515272
COG category	[S] Function unknown
COG ID	[COG4825] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.978362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTATA AAGGTATAGC TAGGATTGAT AAAAGAACTA AAAATTTAGT TAAACGCCTA 
ATATCATCCG ATATTGCTAT AATTGATCAC AAAGATCTTG ACGAAGTGGC TGCCCAATCT 
CTTTTGGAAA CAAAGGTACG TATTGTAGTT AATGCCTCAC ACTCATTAAG TGAGGATTAT 
CCTAATCCAG GTCCGCTTGT CCTGGTAGGT TCCGGCGTGC ATTTAATTGA TAATGCAGGT 
AAAGAAATCA TGTCAGCCAT TTCTGAAGGA CAGGAAATTG AAATTGTTGA GAACCGGATA 
TTGCTAAACG GGGAGCTAAT TGCTGAGGGT AAGTTATTAA GTATAGATTA TATAAAAGAA 
AAAATGTTAG AAACACAAAA ACATATTAAC AGAGTGTTGT CAAAGTTTGT ACAAAACACA 
CTTGAATATG CGCAAAATGA AGTAGGTATG ATTCTTGGTG AAGTTGAAGT ACCTGAGACC 
AGAACGGTTT TTAAAAATAA GCATACACTG ATTGTTGTTA GAGGGAAAAA CTATAAAGAA 
GATTTAAATG CCATAACATC TTATATTAAT GAAGTTAAGC CTGTTCTGGT AGCGGTTGAC 
GGCGGGGCAG ATGCTTTAAT GGAATTTGGT TATCAACCTG ATGTAATTAT TGGTGATATG 
GATAGTATCA GTGACAAAAT GCTGCGATGC GGGGCTGAAT TAATAGTACA TGCCTACCCT 
AACGGCAAGG CGCCCGGTTT AGAGAGATTA AATGAATTGG GTTTGTCTGC CTTGGTTTTT 
CCTGCTCCTG GAACCAGTGA AGATATAGCC ATGCTTTTAG CTTATGAAAA AGGTACTGAT 
TTAATAGTAG CGGTAGGAAC ACATTCCAAC ATGTATGATT TTTTAGAAAA AGGACGAAAA 
GGAATGTCCA GCACATTTCT TGTTAGATTA AAGGTCGGTT CTGTATTAGT TGATGCCAAA 
GGTGTCAGCC AGCTTTATAA AAGTAATATT AAGGTTCGCT ATTTAGCGCA GATTATTCTG 
GCTGCACTGC TGCCATTTAC TATTGTTCTG GTAATTTCTC CTACCACAAG AGAATTACTG 
CGTTTATTAT ATATTCAGTT CCGGCTAATA TTGGGGATAT AA

Protein sequence

MYYKGIARID KRTKNLVKRL ISSDIAIIDH KDLDEVAAQS LLETKVRIVV NASHSLSEDY 
PNPGPLVLVG SGVHLIDNAG KEIMSAISEG QEIEIVENRI LLNGELIAEG KLLSIDYIKE 
KMLETQKHIN RVLSKFVQNT LEYAQNEVGM ILGEVEVPET RTVFKNKHTL IVVRGKNYKE 
DLNAITSYIN EVKPVLVAVD GGADALMEFG YQPDVIIGDM DSISDKMLRC GAELIVHAYP 
NGKAPGLERL NELGLSALVF PAPGTSEDIA MLLAYEKGTD LIVAVGTHSN MYDFLEKGRK 
GMSSTFLVRL KVGSVLVDAK GVSQLYKSNI KVRYLAQIIL AALLPFTIVL VISPTTRELL 
RLLYIQFRLI LGI