Gene Dtox_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3937
Symbol
ID	8430952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4111801
End bp	4112808
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	46%
IMG OID	645036155
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_003193253
Protein GI	258517031
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000958634
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.595989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTAA GATTAGGCAT TAACGGTTTT GGCAGAATTG GGAGATGTGT CTTCCGGGCG 
GCAATGAATA ATCCCGAGGT GGAAATTGTT GCAGTGAATG ATTTAACCGA TGCCGCAACT 
CTGGCCCACC TGTTGAAGTA CGATTCTGTG CATGGTACTT TCGATGCGCA AATCAGTGCT 
GCAGAAGATG CAGTTATTGT TAACGGCAAG ACATTTAAGG TATTGGCCGA AACTAAGCCG 
GAAGCTTTAC CCTGGGGAGA CTTAGGGGTA GATATTGTTG TGGAATCTAC CGGAAGGTTT 
GTCAAGCGTG CAGACGCGGC CAGGCATTTA GCAGGAGGAG CTAAGAAGGT AATTATCTCA 
GCGCCGGCCA AGGAAGAAGA TATTACGGTG GTTATGGGTG TGAACGAGGA TAAATATGAC 
CCAGCCAAAC ATCACGTGCT TTCTAATGCT TCTTGCACTA CTAACTGTTT AGCGCCTTTG 
GCCAAGGTTT TAAATGATAA ATTCGGAATT GTCAAAGGGT TAATGACGAC AGTACATTCT 
TATACCAATG ATCAAAAGAT TTTGGATGCT CCGCATAAGG ATTTAAGGCG GGCCAGAGCC 
GGGGGCATGT CCATAATTCC CACTACTACC GGAGCGGCTA AGGCTGTTTC TCTGGTGCTG 
CCGGAACTGC AGGGAAAATT AAACGGTTTT TCCATGCGTG TACCTACGCC TAATGTGTCT 
GTGGTGGATT TAGTGGTGGA AACTGTCAAG CCTACCTCTG TGGAAGAGGT CAACGCTGTT 
TTAAAAGCTG CGTCTGAGGC CGAATTGAAG GGTATTTTAG AGTATTGTGA CCTGCCTCTT 
GTTTCTAAGG ATTTTAACGG TAACCCTCGA TCTTCGATTT TGGACGCTCT GTCTACCATA 
GTAATCGGCG GCAATATGGT GAAGGTTATC TCCTGGTATG ATAATGAATG GGGTTATTCC 
AACCGGGTTG TTGACTTAGT TTTTTACATG GCCGGCAAGG GATTGTAA

Protein sequence

MAVRLGINGF GRIGRCVFRA AMNNPEVEIV AVNDLTDAAT LAHLLKYDSV HGTFDAQISA 
AEDAVIVNGK TFKVLAETKP EALPWGDLGV DIVVESTGRF VKRADAARHL AGGAKKVIIS 
APAKEEDITV VMGVNEDKYD PAKHHVLSNA SCTTNCLAPL AKVLNDKFGI VKGLMTTVHS 
YTNDQKILDA PHKDLRRARA GGMSIIPTTT GAAKAVSLVL PELQGKLNGF SMRVPTPNVS 
VVDLVVETVK PTSVEEVNAV LKAASEAELK GILEYCDLPL VSKDFNGNPR SSILDALSTI 
VIGGNMVKVI SWYDNEWGYS NRVVDLVFYM AGKGL