Gene RPB_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1994
Symbol	murG
ID	3909500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2265952
End bp	2267052
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	637883888
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_485613
Protein GI	86749117
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.189239
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG CGCCCCTCAT CCTTCTCGCG GCGGGCGGCA CCGGCGGGCA TCTGTTCCCC 
GCCGAGGCGC TCGGCGTGGT GCTGATGAAG CGCGGCCTGC GCGTGCGCCT CGTCACCGAC 
AGCCGCGCGA TGCGCTACAG CGGGTTGTTC TCCGCCGACA TGATCGACGT GGTGCCGAGC 
GAGACGGTGC GCGGCAGGAC GCCGTGGGCG CTGGCCCGGA CCGGGCTGAT GCTCGGTGCC 
GGAACCGCGA AGGCGCTCGC GCTGATGCTG CGGCTGAAGC CCGCCGCAGT GGTCGGCTTC 
GGCGGCTATC CGACGCTGCC GCCCTTGTTC GCGGCGCGGG CGTTGCGGAT TCCGACGCTG 
ATTCACGATT CCAATGCGGT GATGGGCCGC GCCAACCGGC TGCTGTCGAA GGGTGTCACG 
GCGATCGCGA CCTCATTGCC CGGCGTGCTC GACCGCGATC CGACGCTTTC CGCCAAGACC 
ACCACCACCG GCACGCCGAT GCGCCCGGCA ATCCTCGCGG CCGCCGCGGT GCCGTTCGCG 
CCGCTCGCCG CGGAGGGGCC GCTGCGGCTG CTGGTGGTCG GCGGCAGCCA GGGCGCGCGG 
GTGATGGCCG ACATCGTGCC CGGCGCGATC GAGCAGCTCG ATCCGGCGCT GCAGCCGCGG 
CTGGTGCTGA CCCAGCAGGT CCGCGAGGAG GACATGGCGC GGGTCCGCGC CGTCTACGAC 
CGGCTGAAGA TCACCTGCGA GCTCGCTCCG TTCTTCAACG ATCTGCCGGC GCGGCTGGCC 
GCCAGCCAAT TGGTGGTATC ACGTTCCGGT GCTGGCACCG TCGCCGAACT CGCCGCGATC 
GGCCGGCCGT CGATCCTGGT GCCGCTGCCC GGTGCGCTGG ATCAGGACCA GTTCGCCAAT 
GCCGGCGTGC TCGCCGACGC CGGCGGCGCG ATCCGGATCG TGCAGGCCGA CTTCACCCCC 
GAGCGGCTCG CCGACGAGAT CGCCGCGCTG GCCGCCGATC CGCAGAAACT CACCGCGATG 
GTCACCGCCG CCCGCACCGT CGGCCGGCTC GATGCCGCGG ACCGGCTGGC GGATCTGGTC 
GTCAAGGTGG CGAACATCTG A

Protein sequence

MSDAPLILLA AGGTGGHLFP AEALGVVLMK RGLRVRLVTD SRAMRYSGLF SADMIDVVPS 
ETVRGRTPWA LARTGLMLGA GTAKALALML RLKPAAVVGF GGYPTLPPLF AARALRIPTL 
IHDSNAVMGR ANRLLSKGVT AIATSLPGVL DRDPTLSAKT TTTGTPMRPA ILAAAAVPFA 
PLAAEGPLRL LVVGGSQGAR VMADIVPGAI EQLDPALQPR LVLTQQVREE DMARVRAVYD 
RLKITCELAP FFNDLPARLA ASQLVVSRSG AGTVAELAAI GRPSILVPLP GALDQDQFAN 
AGVLADAGGA IRIVQADFTP ERLADEIAAL AADPQKLTAM VTAARTVGRL DAADRLADLV 
VKVANI