Gene Caul_3666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3666
Symbol	murG
ID	5901121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3959304
End bp	3960389
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	73%
IMG OID	641564177
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_001685291
Protein GI	167647628
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.231982
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.103527
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGC TGGTGGTCGT CGCCGCCGGG GGCACCGGCG GACACCTGTT TCCCGCCCAG 
GCCCTGGCCG AGGTGCTGAA GGATCGCGGC TGGCGCGTGG TGCTGGCCAC CGACGAGCGC 
GGCGCGCTGT TCGCCGACAA GTTCCCGGCC GAGGAGCGCC TGGCCCTGTC GGCCGCCACC 
GCCAAGGCCG GCGATCCGAT CGGCATGGTC AAGGCGGGCT TCGCGGTCGC CCAGGGCGTG 
CTGCAGGCCA AGGCCGCCTT CAAGCGCCTG GACCCGGCCG TCGTGGTCGG CTTCGGCGGC 
TATCCCGCCC TGCCAGCCCT GCTGGCGGCC CTGTCCGAGG GCCGGCCGAC GGTGATCCAC 
GAGCAGAACG CGGTGCTGGG CCGGGTCAAC CGCTTCCTGG CCTCGCGCGC CACCGAGGTG 
GCCTGCGCCT TCCCGACCCT GGAAAAGGCC ACGCCCAAGG TGAAGGCCCG CGCCCACGTG 
GTCGGCAATC CGGTGCGGCC CGAGATCCGC GCCCTCTACG ACGTGCCCTA CCTGCCGCCC 
GAGGTGCAAC TGCGGGTGTT GGTCACCGGC GGCAGCCAGG GCGCGCGCCT GCTGTCGGAG 
CTGGTGCCCG AAGCCATCGC CAAGCTGCCC GAGGAGATGC GCGGCCGCCT GAAGGTGCAG 
CAGCAGAGCC GGGCCGAGTC GATGGAGAGC GCCCGCAAGA TCTATCGCAA CGCCATGGTC 
GACTGCGAGG TCGCGCCGTT CTTCCGCGAC ATGGCCGGCC GTCTGCGCCA GGCCCACCTG 
GTGGTCGGCC GGGCCGGCGC CTCGACCTGC TGCGAGCTGG CGGTGGCCGG CCGCCCGTCG 
ATCCTGGTGC CCCTGAAGAT CGCCGCCGAC GACCACCAGC GCTTCAACGC CCGGCAGCTG 
GAAGAGGCGG GCGGGGCGGC GGTGTGCCTG GAGGACGAAC TGACCGTCGA CGCCATGGCC 
GGCGCCCTCA ACGCCCTGCT CAAGGACCCC GAGCGCCTGG CCCGCATGGC CGAGGGCGCG 
CGCAAGGTGG CGACCCCCGA CGCGGCCGAG AAGCTGGCCG ACCTAGTCGT GAGGACCGCG 
CGATAG

Protein sequence

MSKLVVVAAG GTGGHLFPAQ ALAEVLKDRG WRVVLATDER GALFADKFPA EERLALSAAT 
AKAGDPIGMV KAGFAVAQGV LQAKAAFKRL DPAVVVGFGG YPALPALLAA LSEGRPTVIH 
EQNAVLGRVN RFLASRATEV ACAFPTLEKA TPKVKARAHV VGNPVRPEIR ALYDVPYLPP 
EVQLRVLVTG GSQGARLLSE LVPEAIAKLP EEMRGRLKVQ QQSRAESMES ARKIYRNAMV 
DCEVAPFFRD MAGRLRQAHL VVGRAGASTC CELAVAGRPS ILVPLKIAAD DHQRFNARQL 
EEAGGAAVCL EDELTVDAMA GALNALLKDP ERLARMAEGA RKVATPDAAE KLADLVVRTA 
R