Gene CPR_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2034
Symbol	murG
ID	4205666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2246684
End bp	2247757
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	27%
IMG OID	642566584
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_699343
Protein GI	110802613
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAAGT ATAAAATAAT TATGACTGGT GGAGGTTCAG CAGGTCATGT TACCCCAAAT 
TTAGCTTTAG TTCCTAAATT AAAAGAGTTA GGTTTTGAAA TAAAATATAT AGGAAGTAAA 
AATGGTATAG AAAAAGAAAT AATAACTAAG GAAAATATAC CTTATTATTC AATATCATCA 
GGTAAGCTTA GAAGATATTT TGATATAAAA AACTTTACAG ATCCTTTTAA AGTATTAAAA 
GGTGTTATGG ATGCCTCAAG AATACTTTCA AAAGAAAAAC CAGATGTTAT ATTTTCAAAA 
GGTGGCTTTG TTACAGTACC TGTAGTAATA GCAGCCTCAA TGAAAAAAAT TCCTGTGGTA 
TCTCATGAAT CAGATTTAAC CCCTGGATTA GCAAATAAAA TAGCATCACC ATTTTGTGAT 
ACCCTGTGTG TTACATTCCC AGAAAGTTTA AAATATATAA AGGATAATAA AGGGAAATTA 
ACAGGAACTC CAATAAGAGA AGACCTTTTA AAGGGAGATA AAGAAAGAGG AAGAAAGTTC 
TGTAACTTCA AAGAAAATAA AAAAGTTCTT ATGATAATTG GTGGTAGTTT AGGTTCAAAA 
ATTATAAATG AAAGCGTTAG AAAAATTTTA AATGAAATAT TAAAAGAATA TAATGTTATA 
CATTTATGTG GAAAAGGAAA CTTAGATGAA TCATTAAAGA ACTTAGAGGG ATATAGACAA 
TATGAGTATA TATCAGAGGA ACTTCCAGAT TTAATGGCTT TAGCAGATTT AGTTATATCT 
AGAGCAGGAG CAAATACAAT ATTTGAATTA TTAGCTCTTA GAAAGTTAAA TATATTAATA 
CCTTTATCAG CTAATGCTTC AAGAGGAGAT CAAGTTTTAA ATGCTAATTC TTTTGAAAAG 
AGTGGATATT CTATGGTCAT AAAAGAAGAA GAGCTTAATT CAGAATTATT ATTAAAATCA 
ATAAAGGATT TAGAAAAAAA TAGAGAAAAG TACTTAAATT CCATGAAAAT GAGCAAAATA 
GGCAATGGTG TTAATAATAT CATAGATATA ATAAAAAAAT CGGCACATAT GTAA

Protein sequence

MKKYKIIMTG GGSAGHVTPN LALVPKLKEL GFEIKYIGSK NGIEKEIITK ENIPYYSISS 
GKLRRYFDIK NFTDPFKVLK GVMDASRILS KEKPDVIFSK GGFVTVPVVI AASMKKIPVV 
SHESDLTPGL ANKIASPFCD TLCVTFPESL KYIKDNKGKL TGTPIREDLL KGDKERGRKF 
CNFKENKKVL MIIGGSLGSK IINESVRKIL NEILKEYNVI HLCGKGNLDE SLKNLEGYRQ 
YEYISEELPD LMALADLVIS RAGANTIFEL LALRKLNILI PLSANASRGD QVLNANSFEK 
SGYSMVIKEE ELNSELLLKS IKDLEKNREK YLNSMKMSKI GNGVNNIIDI IKKSAHM