Gene Rpal_4046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4046
Symbol	murB
ID	6411729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4341275
End bp	4342204
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	68%
IMG OID	642713928
Product	UDP-N-acetylenolpyruvoylglucosamine reductase
Protein accession	YP_001993017
Protein GI	192292412
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0812] UDP-N-acetylmuramate dehydrogenase
TIGRFAM ID	[TIGR00179] UDP-N-acetylenolpyruvoylglucosamine reductase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.185297
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTCC CCGATATCAC GCCCGATCTG AAAGCCGCGA TGCCGGAGCT GCGCGGGCGG 
CTGCTCGGCA ACGAGCCGCT GGCGCCGCTG ACCTGGTTTC GCGTCGGCGG GCCGGCGCAG 
GTGCTGTTCA CGCCGGCCGA TGAGGATGAT CTCGGTTACT TCCTGTCGCG GCTGCCGGCC 
GAGATTCCGG TGATGTGTCT TGGGCTCGGC TCCAACCTGA TCGTGCGCGA CGGCGGGCTG 
CCCGGCGTCG CGATCCGGCT GTCGCCGCGC GGCTTTGGTG AGCATCGCGT CGAGGGCGAG 
GTGGTCCATG CTGGGGCCGC CGCGCTCGAC AAGCGCGTGG CCGAGACCGC GGCTGCTGCG 
CAGCTCGGCG GGCTGGAGTT CTACTACGGC ATTCCCGGCT CGATCGGCGG TGCGCTGCGG 
ATGAACGCAG GCGCCAACGG CCGCGAGACC AAGGACGTGC TGATCGACGC CACCGCCTAT 
GATCGCAGCG GCACGCGCAA ACTATTCGAC AATGCGGCGA TGCAGTTCTC GTATCGCCAC 
AGCGGCGCCG ATCCTGCGTT GATCTTCACC TCGGCGCGGC TGCGCGGCAC GCCGGCGACG 
CCGGATCACA TCCGCGCCAA GATGAACGAG GTGCAGGCGC ATCGCGAGCT GGCGCAGCCG 
ATCCGCGAGA AGACGGGTGG CTCGACCTTC AAGAATCCGC CCGGCCAGAG TGCGTGGCGC 
CTGATCGATG CTGCCGGCTG CCGCGGCCTC AAGATCGGCG GCGCGCAGGT GTCGGAGATG 
CACTGCAATT TCCTGATCAA CACCGGTGAA GCTACCGCCG CCGATATCGA GACGCTGGGC 
GAGACCGTCC GCGCCCGCGT CAAGGCGCAG TCCGGCGTCG AGCTGCAGTG GGAAATCAAG 
CGGATCGGCG TCGCGGCCGG GCAGAGCTGA

Protein sequence

MSFPDITPDL KAAMPELRGR LLGNEPLAPL TWFRVGGPAQ VLFTPADEDD LGYFLSRLPA 
EIPVMCLGLG SNLIVRDGGL PGVAIRLSPR GFGEHRVEGE VVHAGAAALD KRVAETAAAA 
QLGGLEFYYG IPGSIGGALR MNAGANGRET KDVLIDATAY DRSGTRKLFD NAAMQFSYRH 
SGADPALIFT SARLRGTPAT PDHIRAKMNE VQAHRELAQP IREKTGGSTF KNPPGQSAWR 
LIDAAGCRGL KIGGAQVSEM HCNFLINTGE ATAADIETLG ETVRARVKAQ SGVELQWEIK 
RIGVAAGQS