Gene Rleg_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1994
Symbol
ID	8013030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1991694
End bp	1992887
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	65%
IMG OID	644824581
Product	Serine-type D-Ala-D-Ala carboxypeptidase
Protein accession	YP_002975813
Protein GI	241204717
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1686] D-alanyl-D-alanine carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0979633
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0234131
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGC CCGCGCTTCG CCTGCTTGCA TGCCTGATGC CGTTCGCCAC CGGCGCCTTT 
GCAGCCGATG GCGGTGCCGC CGGTTTCGCC ACCAAGGCGG CGCAGGCCTA TATGATCGAG 
GCCGCCACCG GCACGGTGCT TCTCGCCAAA AACGAGGATC AGGGCTTTTC GCCGGCCTCG 
CTCGCCAAAC TGATGACGAT GGATCTCGCC TTCGAGGCGC TGACCAAGGG CCAGATCACG 
CTCGACACCG AATATCCCGT TTCCGAATAT GCCTGGCGGA CGGGCGGCGC GCCGTCGCGG 
ACGGCAACAA TGTTTGCCAG CCTCAAATCG CGCGTGCGCG TCGAGGACCT GATCAAGGGC 
GTCGCCATCC AGGGCGCCAA CGACAGCTGC ATCATCCTCG CCGAAGGCAT GGCCGGAAGC 
GAGCAGCAAT TTGCCGTGTC GATGACGCGG CGCGCCCGCG AGCTCGGCAT GGAGAAGGCC 
GAGTTCGGAA ATTCCACCGG CCTTCCCGAC GGCAAGAGCA AGGTGACGGC ACGCGAGATG 
GTGACGCTCG CCGCCGCCCT CCAGCAGACC TATCCGAACC TCTATCCCTA TTTCGCGCAG 
CCGGATTTCG AGTGGAACAA GATCTTCCAG CGCAACCGCA ATCCGCTGCT CGGGCTCGAT 
CTCGGCGCCG ATGGGCTGGC GACGGGCTTT ACCGAGGGCG AGGGCTATTC GATCGTCGCT 
TCGGTTGAGC GTGACGGCCG GCGGCTTTTT GTGGCGCTTG CCGGCATCGC CTCCGACAAG 
GAGCGGACGG AGGAAGCCAA ACGCGTACTC GAATGGGGGC TGACGGCCTT CGAGAACCGG 
CAGATCTTCG GCGAGAAGGA AGTGATTGGT GCTGCCAGCG TCTATGGCGG CACGGCGCGT 
ACCGTCGACC TCGTCGCCAA GGCGCCGGTC AGCGTCTATA TCCCGATCAG CAATCCCGAC 
CGGCTGTCGG CGCGCATCAT CTATCGCTGG CCGCTGACGG CGCCGGTCAA GCCGGATACC 
CAGGCAGGAA CGCTGAGGAT TTTCGCAGGC AGCCGGCTGC TCAGGGAAGT GCCGCTTTAT 
ACCGTGCAGG CAGTCGGCGA GGGATCGCTC AGCAGCCGGG CGGTCGATGC CATGCTGGAA 
CTCGGCGAAT CGCTGTTCTT CTCCTGGCTC TGGGACAAGC CCGCGCCCGT CTGA

Protein sequence

MLKPALRLLA CLMPFATGAF AADGGAAGFA TKAAQAYMIE AATGTVLLAK NEDQGFSPAS 
LAKLMTMDLA FEALTKGQIT LDTEYPVSEY AWRTGGAPSR TATMFASLKS RVRVEDLIKG 
VAIQGANDSC IILAEGMAGS EQQFAVSMTR RARELGMEKA EFGNSTGLPD GKSKVTAREM 
VTLAAALQQT YPNLYPYFAQ PDFEWNKIFQ RNRNPLLGLD LGADGLATGF TEGEGYSIVA 
SVERDGRRLF VALAGIASDK ERTEEAKRVL EWGLTAFENR QIFGEKEVIG AASVYGGTAR 
TVDLVAKAPV SVYIPISNPD RLSARIIYRW PLTAPVKPDT QAGTLRIFAG SRLLREVPLY 
TVQAVGEGSL SSRAVDAMLE LGESLFFSWL WDKPAPV