Gene RPD_3394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3394
Symbol	murG
ID	4023906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3771145
End bp	3772245
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	637963599
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_570519
Protein GI	91977860
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.442624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.175652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAG CGCCTCTCAT CCTTCTGGCG GCGGGCGGCA CCGGCGGGCA TCTGTTCCCC 
GCCGAAGCGC TCGGTGTCGT GCTGATGAAG CGTGGCCTGC GCGTGCGCCT GGTCACAGAC 
AGCCGCGCGA TGCGCTACAG CGGCCTGTTT TCCGCCGACA TGATCGACGT GGTGCCGAGC 
GAGACCGTGC GCGGCAGGAC GCCATGGGCG CTGGCGCGCA CCGGCGTGAT GCTCGGCGCC 
GGCACGGCGC TGGCGATCGG CCTGATGATG CGCCTGAGGC CGGCCGCCGT GATCGGCTTC 
GGCGGCTATC CGACGCTGCC GCCGTTGTTC GCGGCGCGCG CGCTGCGCAT CCCGACCCTG 
ATCCACGACG CCAATGCGGT AATGGGCCGC GCCAACCGGC TGCTGTCGCG CCGGGTCAGC 
GCGATCGCGA CCTCGCTGCC CGGGGTGCTC GATCGAGATC CCGAACTCGC CGCCAAGACC 
ACCACCACCG GCACACCGAT GCGTCCGGCC ATCCTCGCCG CCGCCGCGGT GCCGTTTGCG 
CCGCTCGATG CAGAGGAGCC ACTGCGGCTG CTCGTGGTCG GCGGCAGTCA GGGCGCGCGG 
GTGATGGCCG ATATCGTGCC GGGAGCGCTG GACGAACTCG ATCCGGCGCT GCTCCGGCGG 
CTGGCGCTGA CCCAGCAGGT CCGCGACGAA GACATGTCCC GGGTCCGCGC GGTCTACGAC 
CGGTTGAAGA TCGCGTGCGA ACTCGCGCCG TTTTTCTCCG ACCTGCCGGC GCGGCTGGCC 
GCGAGCCAGC TCGTGGTGTC GCGCTCCGGC GCCGGCACCG TGGCCGAACT CGGCGCGATC 
GGCCGGCCGT CGATCCTGGT GCCGCTGCCC GGCGCGCTCG ATCAGGACCA GTTCGCCAAT 
GCCGGCGTGT TGGCCGATGC CGGCGGCGCG ATCCGGATCG TGCAGGGCGA TTTCACTTCC 
GAGCGGCTGG CGGCCGAGAT CACCGCGCTC GCCGCCGATC CGCAGAAGCT CACGGCCATG 
GCGACGGCGG CCCGCACGGT CGGCCGGCTC GACGCGGCCG ACCGGCTCGC CGATCTGGTG 
ATGCAAGTGG CACGAATTTA G

Protein sequence

MSEAPLILLA AGGTGGHLFP AEALGVVLMK RGLRVRLVTD SRAMRYSGLF SADMIDVVPS 
ETVRGRTPWA LARTGVMLGA GTALAIGLMM RLRPAAVIGF GGYPTLPPLF AARALRIPTL 
IHDANAVMGR ANRLLSRRVS AIATSLPGVL DRDPELAAKT TTTGTPMRPA ILAAAAVPFA 
PLDAEEPLRL LVVGGSQGAR VMADIVPGAL DELDPALLRR LALTQQVRDE DMSRVRAVYD 
RLKIACELAP FFSDLPARLA ASQLVVSRSG AGTVAELGAI GRPSILVPLP GALDQDQFAN 
AGVLADAGGA IRIVQGDFTS ERLAAEITAL AADPQKLTAM ATAARTVGRL DAADRLADLV 
MQVARI