Gene TM1040_0728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0728
Symbol	glmU
ID	4076098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	785636
End bp	786985
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	63%
IMG OID	638006025
Product	bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase
Protein accession	YP_612723
Protein GI	99080569
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTG CCCTCGTCAT CCTCGCCGCA GGCAAAGGCA CCAGGATGAA CTCCGATTTG 
CCCAAAGTCC TGCATCAGAT CGCACATGCG CCGATGCTGG AACATGCGAT GCGCGCCGGG 
GGGGCGCTTG ACCCCGAGCG CACGGTGGTT GTGGCAGGCC ACGAGGCCGA GATGGTGCGC 
GCGGCCACCG CAGAGATCGC CCCTGAAGCG ACAGTGGTGC TGCAGGAAGA GCAGCTCGGC 
ACCGGCCACG CGGTACTTCA AGCGCGCGCG GCACTCGAGG GATTTCGCGG CGATGTCGTG 
GTGCTCTATG GCGATACGCC TTTTGTGTCG GCCGAGACGC TGGAACGCAT GATCGAAGCG 
CGCAGCCGCG CCGATCTAGT GATCCTCGGC TTTGAAGCCG CCGATCCTGC GCGCTACGGC 
CGGTTGATCA TGCAGGGCGA AAGCCTTGAG AAAATCGTCG AGTTCAAGGA CGCAAGCGAC 
GCCGAGCGCG CGATTACATT CTGCAACTCG GGCCTCATGG CGTGCAACGC CGAGGTGATG 
TTTGGCCTGC TTGATCAAGT GGGCAACGAC AATGCCTCTG GCGAATACTA CCTGACCGAT 
CTTGTCGAAC TCGCGCGGGC CGAGGGGCTG AGCGTCACGG CCGTGTCCTG CCCCGAAGCG 
GAAACGCTCG GCATCAATTC CCGCGCGGAC CTCGCGGCCG CGGAGGCGGT GTTTCAGGCG 
CATGCGCGGG CTGAGTTGTT GGACATCGGC GTCACGCTGA CGGCTCCTGA GACCGTCCAT 
CTGGCCTTTG ACACCATCAT TGGTCGTGAC ACGGTGATTG AACCCAATGT GGTCTTTGGT 
CCCGGTGTCA CCGTTGAGAG CGGCGCTTTG ATCCGGGCGT TTTCGCACCT TGAGGGCTGC 
CATGTGTCGC GTGGCGCCAA GGTCGGCCCC TACGCCCGCC TGCGCCCCGG CGCGGAGCTG 
GCCGAGGACA CCCATGTGGG CAACTTCGTT GAAATCAAGA ACGCTGAGAT CGCCGCAGGC 
GCCAAGGTGA ACCACCTGAC CTATATTGGC GATGCCTCTG TGGGTGAGGC GACGAATATC 
GGAGCGGGCA CAATCACCTG CAACTACGAT GGCGTCATGA AGCATCGCAC CGAAATCGGC 
GCGCGCGCCT TTATCGGATC AAACACGTGT TTGGTCGCCC CGGTGACCGT TGGCGATGAG 
GCGATGACGG CAACAGGTGC TGTCATCACC AAGGATGTCG CTGATGGAGA TCTGGCGATT 
GCGCGCGTCC AGCAGACGAA CAAACCAGGC CGCGCACGCA AGCTGATGGA TATGCTGCGC 
GCCAAGAAAG CCGCAAAGGC CAAAGGGTAA

Protein sequence

MSTALVILAA GKGTRMNSDL PKVLHQIAHA PMLEHAMRAG GALDPERTVV VAGHEAEMVR 
AATAEIAPEA TVVLQEEQLG TGHAVLQARA ALEGFRGDVV VLYGDTPFVS AETLERMIEA 
RSRADLVILG FEAADPARYG RLIMQGESLE KIVEFKDASD AERAITFCNS GLMACNAEVM 
FGLLDQVGND NASGEYYLTD LVELARAEGL SVTAVSCPEA ETLGINSRAD LAAAEAVFQA 
HARAELLDIG VTLTAPETVH LAFDTIIGRD TVIEPNVVFG PGVTVESGAL IRAFSHLEGC 
HVSRGAKVGP YARLRPGAEL AEDTHVGNFV EIKNAEIAAG AKVNHLTYIG DASVGEATNI 
GAGTITCNYD GVMKHRTEIG ARAFIGSNTC LVAPVTVGDE AMTATGAVIT KDVADGDLAI 
ARVQQTNKPG RARKLMDMLR AKKAAKAKG