Gene BCZK0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK0044
Symbol	glmU
ID	3025510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	+
Start bp	51145
End bp	52524
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	38%
IMG OID	637544204
Product	bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase
Protein accession	YP_081661
Protein GI	52145169
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0363259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAACA GATTTGCAGT GATTCTAGCT GCAGGTAAAG GCACACGTAT GAAGTCTAAG 
CTATACAAAG TGCTTCATCC TGTATGTGGA AAACCTATGG TACAACATGT TGTCGATCAA 
GTATCTCAAT TAGGGTTGCA GAAACTTGTA ACAGTCGTAG GACATGGTGC TGAAATGGTA 
CAAGAACAGC TAGGAAACGT AAGTGAGTTT GCATTACAAG CAGAACAACT TGGTACAGCG 
CATGCTGTAG ATCAAGCTGC AGGTGTACTT GCAAATGAAG AAGGAACAAC TTTAGTTATT 
TGTGGTGATA CGCCGCTAAT AACTGCTGAA ACGATGGAAG CATTACTTCA GCAACATAAA 
GAAGCAGGGG CAATGGCAAC GGTGTTAACA GCTTACATAG AAGAACCTGC TGGATATGGT 
CGTATCGTTC GTAATGAGAA TGGTCATGTT GAAAAGATTG TTGAGCATAA GGATGCAAAT 
GAGAAAGAAT TAGCTATTAA AGAAATCAAT ACAGGTACGT ATTGTTTTGA TAATAAAGCT 
TTATTCGCTT CACTTTCTAA GGTTTCAAAT GATAACGTAC AAGGTGAATA TTACCTGCCA 
GATGTTATTG AGATTTTAAA AAATGAAGGT CATATTGTAT CGGCTTATCA AACAGAGCAC 
TTCGATGAAA CGTTAGGTGT TAACGACAGA GTCGCTCTAT CGCAAGCGGA AATTATTATG 
AAAAACCGTA TCAACCGAAA GAACATGGTA AATGGTGTTA CAATTATTGA TCCAAGTAAC 
ACGTATATTT CTGCTGATGC AATTATCGGT AGTGATACAG TTCTTCATCC AGGAACAATT 
ATTGAGGGGA ACACTGTAAT TGGTTCTGAT TGTGAAATTG GACCGCATAC AGTAATTCGC 
GATAGTGAAA TTGGAGATCG TACGACAATT CGTCAATCTA CTGTACATGA TAGTAAGCTT 
GGTACAGAAG TATCGGTTGG TCCATTTGCA CATATTCGCC CAGATTCAGT TATTGGAGAT 
GAAGTACGCG TTGGAAACTT CGTGGAAATC AAAAAAACTG TTTTTGGTAA TAGAAGTAAA 
GCTTCACACT TAAGTTATAT CGGGGATGCA CAAATTGGAG AAGACGTGAA TCTTGGTTGT 
GGTTCAATTA CGGTGAACTA TGACGGTAAG AATAAATTCA AAACTGTGAT TGGTAACGGG 
GTATTTATTG GATGTAATTC AAACCTTGTT GCTCCTGTAA CAGTTGAAGA TGGTGCTTAT 
GTGGCAGCAG GCTCTACAAT TACAGAGAAT GTTCCATCAA AAGCATTATC TGTAGCACGT 
GCACGTCAAG TTAACAAAGA AGACTATGTT GATCAATTGC TGAATAAGAA AAAATCATAA

Protein sequence

MSNRFAVILA AGKGTRMKSK LYKVLHPVCG KPMVQHVVDQ VSQLGLQKLV TVVGHGAEMV 
QEQLGNVSEF ALQAEQLGTA HAVDQAAGVL ANEEGTTLVI CGDTPLITAE TMEALLQQHK 
EAGAMATVLT AYIEEPAGYG RIVRNENGHV EKIVEHKDAN EKELAIKEIN TGTYCFDNKA 
LFASLSKVSN DNVQGEYYLP DVIEILKNEG HIVSAYQTEH FDETLGVNDR VALSQAEIIM 
KNRINRKNMV NGVTIIDPSN TYISADAIIG SDTVLHPGTI IEGNTVIGSD CEIGPHTVIR 
DSEIGDRTTI RQSTVHDSKL GTEVSVGPFA HIRPDSVIGD EVRVGNFVEI KKTVFGNRSK 
ASHLSYIGDA QIGEDVNLGC GSITVNYDGK NKFKTVIGNG VFIGCNSNLV APVTVEDGAY 
VAAGSTITEN VPSKALSVAR ARQVNKEDYV DQLLNKKKS