Gene GWCH70_3331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3331
Symbol
ID	7979223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3355404
End bp	3356690
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	48%
IMG OID	644800098
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_002951237
Protein GI	239828613
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.683565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAA TCAAAATTAT CGGCGGTGAT CCGCTGCAGG GAACGATCAA GGTAAGCGGC 
GCAAAAAATA GCGCCGTTGC CCTCATCCCT GCTACGATTC TCGCTGATTC ACCGGTTACA 
ATCGAAGGAT TGCCGGACAT TTCTGATGTG CGAATTTTAG GCGACTTAAT TAAAGAGATT 
GGCGGAACGT TCCATTTCGA TGGCAAAAAA GCGGTCATCG ATCCGACCAA TATGGTACCG 
ATGCCGCTGC CGAATGGAAA AGTAAAAAAA TTGCGTGCTT CGTATTATTT AATGGGAGCA 
ATGCTTGGTC GTTTTAAAAA AGCGGTTGTC GGGCTGCCAG GAGGCTGCCA TCTAGGTCCG 
CGCCCGATTG ACCAGCATAT TAAAGGCTTT GAGGCGCTAG GAGCGAAAGT AACGAACGAG 
CAAGGTGCGA TTTATTTGCG CGCGGAGGAA TTGCGAGGTG CCCGTATTTT TTTAGATGTG 
GTAAGCGTAG GGGCAACGAT TAACATCATG TTGGCCGCGG TGCGCGCCAA AGGCCGGACG 
ATTATTGAAA ACGCTGCAAA AGAGCCGGAA ATTATTGATG TGGCGACATT GCTTTCCAAC 
ATGGGAGCAA AAATTAAAGG CGCCGGAACC GATGTCATTC GCATCGACGG TGTTGAGAAA 
TTATCAGGAT GTCGTCATTC GATTATTCCG GACCGCATTG AGGCTGGTAC ATATATGATT 
GCTGCGGCAG CGATGGGGAA AGAAGTAGTC GTTGATAACG TTATTCCTCA GCATGTTGAA 
TCATTGATCG CAAAATTGCG CGAAATGGGC GTGCATGTAG AAACGAGCGA CGATCAAATC 
CTTGTTTCCA GTGCACCAAC TTTAAAAGCA GTGGACGTGA AAACGCTTGT TTATCCTGGT 
TTTCCAACCG ACTTACAGCA GCCGTTTACA GCGCTTTTAA CAAAAGCGCA CGGGACAAGC 
GTTGTCACGG ATACGATTTA TAGCGCCCGC TTTAAGCATG TCGATGAACT TCGCAGAATG 
AATGCGAACA TAAAGGTGGA AGGTCGTTCC GCCATTATTA CCGGTCCGGT TCGGCTACAG 
GGCGCAAAAG TAAAAGCGAG CGATTTGCGC GCAGGCGCAG CGCTTGTGGT TGCTGGTTTA 
ATGGCACAAG GGCTTACGGA AATCACGGGA GTGGAGCACA TTGACCGCGG ATACAGCAAT 
CTTGTCGAAA AGTTAAATAG CATAGGAGCA ACGATTTGGC GAGAAAAAAT GACGGACGAA 
GAGATTGAAC AAGTCAAAAA TGCATAG

Protein sequence

MEKIKIIGGD PLQGTIKVSG AKNSAVALIP ATILADSPVT IEGLPDISDV RILGDLIKEI 
GGTFHFDGKK AVIDPTNMVP MPLPNGKVKK LRASYYLMGA MLGRFKKAVV GLPGGCHLGP 
RPIDQHIKGF EALGAKVTNE QGAIYLRAEE LRGARIFLDV VSVGATINIM LAAVRAKGRT 
IIENAAKEPE IIDVATLLSN MGAKIKGAGT DVIRIDGVEK LSGCRHSIIP DRIEAGTYMI 
AAAAMGKEVV VDNVIPQHVE SLIAKLREMG VHVETSDDQI LVSSAPTLKA VDVKTLVYPG 
FPTDLQQPFT ALLTKAHGTS VVTDTIYSAR FKHVDELRRM NANIKVEGRS AIITGPVRLQ 
GAKVKASDLR AGAALVVAGL MAQGLTEITG VEHIDRGYSN LVEKLNSIGA TIWREKMTDE 
EIEQVKNA