Gene Avin_51920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_51920
Symbol	glmU
ID	7764029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	5294919
End bp	5296283
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	70%
IMG OID	643808008
Product	UDP-N-acetylglucosamine pyrophosphorylase; GlmU
Protein accession	YP_002802242
Protein GI	226947169
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTCG ATATCGTCAT TCTCGCCGCC GGCCAGGGCA CGCGCATGCG TTCCGCCCTG 
CCGAAAGTCC TGCACCCGGT CGCCGGCAAT TCGATGCTCG GCCATGTCGT CGCCACGGCC 
CGCCAACTGC AGCCGCAGGG CATCCACGTG GTGATCGGGC ACGGCGCCGA ACGGGTGCGC 
GAGCGGCTGG CGGCGGACGA CCTGAACTTC GTCCTGCAGG CCGAGCAACT GGGCACCGGG 
CACGCCGTGG CCCAGGCGCT GCCGGCACTG TCCGCCGAGC GGGTGCTGAT CCTCTACGGC 
GACGTGCCGC TGATCGAGGC GGACACCCTG CGCCGCCTGC TGGCGCAGGT CGGCCCCGAG 
CGCCTGGCCC TGCTCACCGT GGACCTGGTC GATCCCAGCG GCTACGGGCG GATCGTCCGC 
GATGCCGCCG GGCGGGTGGT CGCCATCGTC GAGCACAAGG ACGCCAGCCC CGAGCAGCGC 
GCCATCTGCG AGGGCAACAC CGGCATCCTC GCGGTGCCCG GCGCGCGCCT GGCCGACTGG 
CTGGGGCGGC TGTCCAACGA CAATGTCCAG GGCGAGTACT ACCTCACCGA CGTGATCGCC 
ATGGCGGTGG CCGACGGCCT GACGATCGCC ACCGAGCAGC CGCAGGACGC CATGGAGGTG 
CAGGGCGCCA ACGACCGCCT GCAGCTCGCC CAACTGGAGC GCCACTACCA GTCGCGCGTC 
GCCCGAAGGC TGATGGCCCA GGGCGTGACC CTGCGCGATC CGGCGCGATT CGACCTGCGC 
GGCGAAGTCG AGGTCGGCCG CGACGTGCTG ATCGACGTCA ATGTGATCCT CGAAGGCAAG 
GTGATCATCG AGGACGGCGT GGAAATCGGC CCGAACTGCA CGATCAAGGA CAGCACCCTG 
CGCCGGGGCG CCCAGGTCAA GGCCAACAGC CACCTGGAAG GCGCCGAGCT GGGCGAGGGC 
GCCGACTGCG GTCCCTTCGC CCGCCTGCGT CCGGGCGCGG TGCTGGGTGC CAAGGCCCAC 
GTCGGCAACT TCGTCGAGCT GAAGAACGCC GTGCTGGGCG AGGGCGCCAA GGCCGGGCAC 
CTGTCCTACC TGGGCGATGC CGAGATCGGC GCGCGGACCA ACATCGGCGC CGGCACCATC 
ACCTGCAACT ACGACGGCGC CAACAAGTTC AGGACGGTGA TGGGCGAGGA TGTGTTCATC 
GGCTCGAACA GCGCCCTGGT CGCCCCGGTC GAACTCGGCG CCGGCGCCAC CACCGGCGCC 
GGCTCGGTGA TCACCGAGGA TGTGCCGGCC GGCAACCTGG CCCTCGGCCG TGGACGCCAG 
CGCAATATCG AAGGCTGGCA GCGGCCCACC AAGCAAAAGA AATAG

Protein sequence

MSLDIVILAA GQGTRMRSAL PKVLHPVAGN SMLGHVVATA RQLQPQGIHV VIGHGAERVR 
ERLAADDLNF VLQAEQLGTG HAVAQALPAL SAERVLILYG DVPLIEADTL RRLLAQVGPE 
RLALLTVDLV DPSGYGRIVR DAAGRVVAIV EHKDASPEQR AICEGNTGIL AVPGARLADW 
LGRLSNDNVQ GEYYLTDVIA MAVADGLTIA TEQPQDAMEV QGANDRLQLA QLERHYQSRV 
ARRLMAQGVT LRDPARFDLR GEVEVGRDVL IDVNVILEGK VIIEDGVEIG PNCTIKDSTL 
RRGAQVKANS HLEGAELGEG ADCGPFARLR PGAVLGAKAH VGNFVELKNA VLGEGAKAGH 
LSYLGDAEIG ARTNIGAGTI TCNYDGANKF RTVMGEDVFI GSNSALVAPV ELGAGATTGA 
GSVITEDVPA GNLALGRGRQ RNIEGWQRPT KQKK