Gene Dtox_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0072
Symbol
ID	8426994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	76973
End bp	78229
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	44%
IMG OID	645032467
Product	UDP-N-acetylglucosamine1- carboxyvinyltransferase
Protein accession	YP_003189658
Protein GI	258513436
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000298929
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.037429
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATA TTGCTATCGT AGGGGGGCAA AGGCTTCAGG GAAAAGTAAA AGTCAGCGGA 
GCAAAAAATG CAACTCTTGC GATACTTGGA GCAGCTTTGT TGGCTAATGA AAGTATTATC 
CTGGAGAATG TGCCCGACAT AAGTGATGTT AGGATAATGG TAAATATCAT TCGTGATTTG 
GGCGGGGAGA TTGATTGGTT GGACAAGGAA GTAATATCTT TTGTTCCGCC TAAAGAAATT 
AAAAAATCTC CTATATATAA TAATGTAAAG AAATTGCGCG CCTCCAATTT ATTGCTTGGG 
CCTCTATTGG CCAAGTTTGG TTATGCTGAA GTGGCTCTTC CCGGAGGGTG CAATATCGGA 
GTGCGGCCTA TGGACTTGCA TTTTAAAGGG TTGGCCGGTC TAGGTGCGGA TTTATATATA 
GAGAGAGGTT GTGTCAAAGG ATCTGCTAAG AAACTTGCAG GTGCCAGAAT ATATCTTGAT 
TTTCCCAGTG TTGGAGCTAC TGAGAATATA ATGATGGCTG CCTGTCTGGC TGAGGGACAG 
ACTATTATTG AAAACGTTGC CAAGGAGCCG GAAATAGTTG ATTTGGCAAA TTTTTTAAAC 
AGTCTGGGCG GCAAAGTGCG AGGGGCAGGC ACAGATGTTA TAAAAATAGA AGGAGTAAAA 
TCTTTAGATC GCGGTGGTCG CTATGCTGTA ATTCCTGATC GCATTGAGGC CGGAACTTTT 
ATGGTAGCTA TTGCGGCGAC AAGGGGTGAT GCGATCCTTG AGGGGGTTAT TCCCAGGCAT 
ATTGAGCCTC TTATAGCCAA GTTGCGGGAG GCTAATGTTG AGATAACTGA GGAAGGGGAT 
AATCTAAGAG TCAGAGCGGT TAGCCAACTA AATCCCATAG ATATCAAGAC GCTGCCTTAC 
CCTGGTTTTC CAACTGATAT GCAGTCGCAG GTAATGACGC TGCTGACAAA TGTGCCGGGA 
ACCAGTATAA TTATAGAGAA TATTTTCGAA AATAGATTTC AGATTTCAGA TGAATTAAAG 
AGAATGGGAG CTCAAATCAA GGTTGAAGGG CGTATGGCTG TAATTGAGGG TGTTGCATCT 
TTACAGGGGA CTGTTGTTAA GGCCTCTGAT TTGCGGGCCG GTGCTGCTTT GGTAATTGCC 
GGTTTAATGG CAGAAGGAGT TACCGAAATC ATCAATTCTT TTTACATTGA CAGGGGATAC 
CAGGACTTGG AGGATAAATT ATCTTCGCTG GGTGCTAAGA TCTGGAGAAA CGATTGA

Protein sequence

MSNIAIVGGQ RLQGKVKVSG AKNATLAILG AALLANESII LENVPDISDV RIMVNIIRDL 
GGEIDWLDKE VISFVPPKEI KKSPIYNNVK KLRASNLLLG PLLAKFGYAE VALPGGCNIG 
VRPMDLHFKG LAGLGADLYI ERGCVKGSAK KLAGARIYLD FPSVGATENI MMAACLAEGQ 
TIIENVAKEP EIVDLANFLN SLGGKVRGAG TDVIKIEGVK SLDRGGRYAV IPDRIEAGTF 
MVAIAATRGD AILEGVIPRH IEPLIAKLRE ANVEITEEGD NLRVRAVSQL NPIDIKTLPY 
PGFPTDMQSQ VMTLLTNVPG TSIIIENIFE NRFQISDELK RMGAQIKVEG RMAVIEGVAS 
LQGTVVKASD LRAGAALVIA GLMAEGVTEI INSFYIDRGY QDLEDKLSSL GAKIWRND