Gene RPD_3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3398
Symbol
ID	4023910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3776281
End bp	3777720
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	67%
IMG OID	637963603
Product	UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6-diaminopimelate--D-alanyl-D-alanine ligase
Protein accession	YP_570523
Protein GI	91977864
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.146335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.470298
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAC CACCGCTGTG GACTTCGGAT GCGATGGCGG AGGCGATGCG CGCCGCCGCG 
AGCGGCTCGC TGCCGCGCGA CGTGTTCGGC ATTTCGATCG ACAGCCGCAC GCTGGCGCCG 
GGCGATGCGT ATTTCGCGAT CAAGGGTGAC GTCCATGATG GTCACGATTT CGTCGCCGCC 
GCGCTGAATG CCGGCGCGGC GCTGGCGGTG GTGGAAAGGG CGCAGCGCGC CAAGTTCGCC 
GCCGACGCGC CGCTGCTGGT GGTCGACGAC GTACTCGACG GATTGCGCGA GCTCGGCCGC 
GCGGCGCGGG CGCGGCTCGA CGCCAAGATC ATCGCGGTGA CCGGCTCGGT CGGCAAGACC 
TCGACCAAGG AAGCGCTGCG CGGCGTGCTC GGGGCGCAAG GCGAGACCCA CGCTTCGGTG 
GCGTCGTTCA ACAATCACTG GGGCGTGCCG CTGTCGTTGG CGCGCTGTCC GGCGGACGTG 
CGCTACGCGG TGTTCGAAAT CGGCATGAAC CACGCGGGTG AAATCGAACC GCTGGTGAAG 
ATGGTGCGAC CACATCTGGT GATCATCACC ACGGTGGAGC CGGTGCACCT CGAGTTCTTC 
TCCGGCATCG AAGCGATCGC CGACGCCAAG GCGGAAATCT TCGCTGGGCT GGTGCCCGGC 
GGCACGGCGG TTCTCAATCG CGACAATGCG ATGTTCAAGC GGCTCACCGA CAGCGCCCGC 
AAGGCCGGCG TCGGTCGCGT CGTATCGTTC GGTGCCGATG TCGAGGCCGA TGCGCGGCTG 
CTCGACGTCG CGTTGCACGC CGATTGCTCC GCGGTGCATG CGACGATTTT CGGCCGCGAC 
GTCACTTACA AGCTCGGGAT TCCCGGGCGG CATATCGCGA TGAATTCTCT GGCCGTATTG 
GCCGCGGCGG AAACTGTCGG CGCTGATCTC GCGCTGGCGG CGCTGGCGCT GTCGCACGTC 
CAGCCCGCCG CCGGCCGTGG CGTCCGCCGC GCGCTCGAAT TCGGGCAAAG CGAGGCCACG 
CTGATCGACG AGAGCTATAA TGCCAATCCG GCGTCGATGG TGGCGGCGCT GGGCGTGCTC 
GGCCAGGTCC CGGTCGGTCC GCAGGGTCGG CGGATCGTTG TGCTCGGCGA CATGCTGGAA 
CTCGGCCCGG CCGGGCCGGA GTTGCATCGC GACCTCGCCG AGTCGGTGCG GAATAACGCA 
ATCGATCTGG TGTTCTGCTG CGGTCCGCTG ATGCGCAATT TGTGGGACGC CCTTTCCTCA 
GGGAAGCGAG GGGGCTATGC AGAGACCGCG GCCGCGCTCG AATCTCAGGT GGTTGCGGCG 
ATCCGTGCCG GCGACGTGCT GATGATCAAA GGCTCGCTCG GCTCGCGCAT GAAAACGATT 
GTCACCGCGC TCGAGAAGCG CTTTCCCGGC AAGACCGCGC GCGATGACGC TGCGGTGTAA

Protein sequence

MSKPPLWTSD AMAEAMRAAA SGSLPRDVFG ISIDSRTLAP GDAYFAIKGD VHDGHDFVAA 
ALNAGAALAV VERAQRAKFA ADAPLLVVDD VLDGLRELGR AARARLDAKI IAVTGSVGKT 
STKEALRGVL GAQGETHASV ASFNNHWGVP LSLARCPADV RYAVFEIGMN HAGEIEPLVK 
MVRPHLVIIT TVEPVHLEFF SGIEAIADAK AEIFAGLVPG GTAVLNRDNA MFKRLTDSAR 
KAGVGRVVSF GADVEADARL LDVALHADCS AVHATIFGRD VTYKLGIPGR HIAMNSLAVL 
AAAETVGADL ALAALALSHV QPAAGRGVRR ALEFGQSEAT LIDESYNANP ASMVAALGVL 
GQVPVGPQGR RIVVLGDMLE LGPAGPELHR DLAESVRNNA IDLVFCCGPL MRNLWDALSS 
GKRGGYAETA AALESQVVAA IRAGDVLMIK GSLGSRMKTI VTALEKRFPG KTARDDAAV