Gene Rleg_4141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4141
Symbol
ID	8014935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4226031
End bp	4227479
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	64%
IMG OID	644826711
Product	peptidase M48 Ste24p
Protein accession	YP_002977921
Protein GI	241206825
COG category	[R] General function prediction only
COG ID	[COG4784] Putative Zn-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0703431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.108462
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCTGC TTTCGGCCGT CGCAATGGCG CTGAATGGCT GCCAAACGCT GATCGACCAA 
TCCTATCAGC CGAGTGTTTC GCCGTCTTCC AATCCACAGA TCGTCGACGA GGTGCAGAAA 
AACGACCCGC GCGCGGCGAT GGGCGCCCGC GAGCATCCGC GCATCGTGGC AAGCTACGGC 
GGCGAATACA AGGACGCCAA AACCGAGCGC CTCGTCGCCC GCATCGCCGG CGCGCTGACG 
GCGGTGTCGG AAAATCCGAG CCAGTCCTAC CGCATCACCA TCCTGAATTC GCCGGCGATC 
AACGCCTTTG CGCTGCCGGG CGGTTATCTC TACGTCACCC GCGGCCTGCT CGCCCTTGCC 
AACGACGCTT CGGAAGTTGC CGCCGTGCTG TCGCACGAAA TGGGCCATGT GACGGCGAAC 
CACGGCATCG AGCGGCAGAA GCGCGAAGAG GCTGAGGTTA TCGCCAGCCG CGTCGTCGCC 
GAAGTCCTTT CCAGCGACAT CGCCGGCAAG CAGGCGCTTG CCCGCGGCAA GCTGCGGCTC 
GCCGCCTTCT CCCGCCAGCA GGAGCTGCAG GCCGATGTCA TCGGTGTGCG CATGCTCGGT 
GAAGCTGGCT ATGATCCCTA TGCCGCTGCC CGTTTCCTCG ATTCGATGGC GGCTTACAGT 
CGCTTCATGT CGGTTGATCC CGAAGCCGAC CAGAGCCTCG ACTTCCTGTC GAGCCATCCG 
AATTCGGCTC AGCGCATAGA GCTCGCCCGC ACCCACGCCC GCGCCTTCGG CCAGGAAGGC 
TCGGTCGGCG ACAAGGGCCG CGATTATTAT CTCGACGGCA TAGACGGACT GCTCTACGGC 
GACAGCCCGG AAGAAGGCTA TGTGCGCGGC CAGACCTTCC TGCATGGCGG CCTCGGCATC 
CGCTTCGACG TGCCGCCGGA TTTCCACATC GACAACAAGG TCGAGGCGGT GATGGCCACC 
GGTCCGAACG ACATCGCCGT CCGCTTCGAC GGCGTCGCCG ACAATCAGAA CCAGAGCCTC 
ACCAACTATA TCTCCAGCGG CTGGGTAACC GGCCTCGACC CGTCGACCAT CCAACCGATC 
ACCATCAACG GCATGGAAGC AGCCACCGCG CGCGCCAGCG CCGACCGCTG GGATTTCGAT 
GTCACCGTGA TCCGCAACAA TTCGCAGATC TTCCGTTTCC TGACCGCCGT GCCGAAAGGC 
AGCGGCGCCC TTGAGCCAAC GGCGAATGTG CTGCGCGCGA GTTTCCGCCG CATGACGCCG 
GCAGAGGCCG CCTCGCTGAA ACCGCTGCGC ATCCGCGTCG TCACCGTCCG GCCGGGTGAG 
AACATCTCGA CGCTCGCCGC CCGCATGATG GGCACAGACC GCAAGCTCGA TCTCTTCAAG 
CTCATCAATG CCCTGCCCAC GGGTGCAGCC GTTTCTATAG GCGATCGCGT CAAGATCATC 
GCCGAATAA

Protein sequence

MMLLSAVAMA LNGCQTLIDQ SYQPSVSPSS NPQIVDEVQK NDPRAAMGAR EHPRIVASYG 
GEYKDAKTER LVARIAGALT AVSENPSQSY RITILNSPAI NAFALPGGYL YVTRGLLALA 
NDASEVAAVL SHEMGHVTAN HGIERQKREE AEVIASRVVA EVLSSDIAGK QALARGKLRL 
AAFSRQQELQ ADVIGVRMLG EAGYDPYAAA RFLDSMAAYS RFMSVDPEAD QSLDFLSSHP 
NSAQRIELAR THARAFGQEG SVGDKGRDYY LDGIDGLLYG DSPEEGYVRG QTFLHGGLGI 
RFDVPPDFHI DNKVEAVMAT GPNDIAVRFD GVADNQNQSL TNYISSGWVT GLDPSTIQPI 
TINGMEAATA RASADRWDFD VTVIRNNSQI FRFLTAVPKG SGALEPTANV LRASFRRMTP 
AEAASLKPLR IRVVTVRPGE NISTLAARMM GTDRKLDLFK LINALPTGAA VSIGDRVKII 
AE