Gene Rpal_4052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4052
Symbol
ID	6411735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4348916
End bp	4350355
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	642713934
Product	UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6-diaminopimelate--D-alanyl-D-alanine ligase
Protein accession	YP_001993023
Protein GI	192292418
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.11633
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAC AACCGCTTTG GACCTCCGAC GCAATGGCGG AGGCGATGGC TGCCACGCGC 
AGCGGCACGC TGCCGCGCGA TGTATATGGG ATTTCGATCG ACAGCCGCAC GTTGGCACCG 
GGCGATGCTT ACTTCGCCAT CAAGGGCGAT GTTCATGACG GCCATGACTT CGTCGCCGCG 
GCGCTGAACG CCGGCGCCGC GCTGGCGGTG GTGGAGAAGG CGCAGCGCGC CAAGTTCGCT 
CCCGATGCGC CGCTGCTCGT CGTCGATGAC GTGCTCGAAG GACTACGCCA GCTCGGCATC 
GCGGCGCGCT CGCGGCTGCC CGCCAAAGTG ATCGCGGTGA CCGGCTCGGT CGGCAAGACC 
TCGACCAAGG AAGGTCTGCG CGGCGTGCTC GGCGCGCAGG GCGCGACCCA CGCCTCGGTG 
GCGTCGTTCA ACAATCACTG GGGCGTGCCG CTGTCGCTGG CGCGCTGTCC GGTGGACTCG 
CGGTTTGCGG TGTTCGAGAT CGGCATGAAC CACGCCGGCG AGATCGAGCC GCTGGTGAAG 
ATGGTGCGGC CGCACATTGC GATCATCACC ACGGTCGAAG CCGTGCATCT CGAGTTCTTC 
TCCGGCATCG AGGGCATCGC CGATGCCAAG TCGGAGATCT TCACCGGGCT CGAGCCGGGC 
GGCATCGCCG TGCTGAACCG TGATACGCCG ATGTTCGACC GGCTGTGCAG CAATGCGTTG 
CGCGCCAATG TCGGTCGCAT CGTCACCTTC GGTGCCGATC CCGCCGCCGA TGCGCGGCTG 
CTCGATGTCG CGCTGCATGC CGACTGCTCG GCCGTGCATG CCAGCATTCT CGGCCACGAC 
GTCACCTACA AGCTCGGCAT GCCGGGCCGG CACATGGCGC TGAATTCGCT GGCGGTGCTG 
GCCGCTGCGG AGCTTGCCGG CGCCGACCTC GCGCTCGCCG CGCTGGCGCT GTCGCAGGTC 
GCACCCGCCG CCGGCCGCGG CGTCCGCAAG CCGTTGCCTG TCGGCTCCGG CGAGGCGACG 
CTGATCGACG AGAGCTACAA CGCCAATCCG GCCTCGATGG CCGCGGCGCT TGGCGTGCTC 
GGCCGCGCCG AAATCAGCGG GCAGGGGCGG CGGATCGCCG TGCTGGGCGA TATGCTCGAA 
CTCGGCCCGC GCGGCCCGGA GCTGCACCGG GGCCTGGAAG AGGCGGTGCG GGCCAATGGC 
ATCGACCTGG TGTTCTGCTG CGGCCCGTTG ATGCGCAATT TGTGGGACGC CCTTTCCTCC 
GGCAAACGAG GGGGCTATGC AGGCGACGCG GCCGCGCTCG AATCCCAAGT CGTCGCCGCA 
ATCCGAGCCG GCGACGTCGT GATGGTGAAG GGGTCGCTCG GTTCGCGCAT GAAAACCATT 
GTCACCGCGC TCGAGAAGCG CTTCCCCGGC ACGACCGCAC GCGACGACGC TGCGGTGTAA

Protein sequence

MSKQPLWTSD AMAEAMAATR SGTLPRDVYG ISIDSRTLAP GDAYFAIKGD VHDGHDFVAA 
ALNAGAALAV VEKAQRAKFA PDAPLLVVDD VLEGLRQLGI AARSRLPAKV IAVTGSVGKT 
STKEGLRGVL GAQGATHASV ASFNNHWGVP LSLARCPVDS RFAVFEIGMN HAGEIEPLVK 
MVRPHIAIIT TVEAVHLEFF SGIEGIADAK SEIFTGLEPG GIAVLNRDTP MFDRLCSNAL 
RANVGRIVTF GADPAADARL LDVALHADCS AVHASILGHD VTYKLGMPGR HMALNSLAVL 
AAAELAGADL ALAALALSQV APAAGRGVRK PLPVGSGEAT LIDESYNANP ASMAAALGVL 
GRAEISGQGR RIAVLGDMLE LGPRGPELHR GLEEAVRANG IDLVFCCGPL MRNLWDALSS 
GKRGGYAGDA AALESQVVAA IRAGDVVMVK GSLGSRMKTI VTALEKRFPG TTARDDAAV