Gene Rleg2_0388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0388
Symbol
ID	6979103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	401324
End bp	402373
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	643395101
Product	peptidase M48 Ste24p
Protein accession	YP_002279913
Protein GI	209547996
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0132188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.117009
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTTTCTG ACGCAGAGAC CGTCGCCAAA GGGGAATGGT ATCCGCCGCA TTCGAGCGGC 
TCCGTTCCCG CACGCCTGCT GTCGCGCGGC GGGCGCCTGC TCGCCGTAAC CGACGAGGAT 
GTCGCCCTTT CGGACAGCGC GGCCGGAGAG CTCTCCTTCA CGCCGCGCGT CGGGTCGATC 
CCCCGACGCG CCGTCTTTGC CGACGGCTCG GTCTTCGAGA GCAGCGACAA TGATGCCATC 
GATGCCTTTC TTCGCGGCGG CGGCAGAAGC GGCTGGGTAC ATCGGCTGGA GGAATTTCAT 
CCCCGCATCT TCGTCTTCGC GGTCGCGGTC GTTCTGCTCG CCGTCGGAAT CTATCGTTAC 
GCGCTGCCGG TGCTCGTCGA AGTCGCCGTC TTGGTGACGC CGCCTGTTGT TTCCGAGGCA 
ATGTCCTATA GCGCTCTCAA CACGCTCGAC AGGACGGCGC TGTCCGCCAG CCAGTTGGAC 
GAAGCCCGGC AGGCCGAAAT CGCCGCTCGC TTCCGTCAGG TCGCTGCCAA TGCCGAAGGC 
GGCGCCGGCC GTTATGTGCT GAATTTCCGC GATGGCGGCT TGATCGGTCC CAATGCTTTC 
GCGCTTCCCG ACGGCAACAT CGTCATCACC GACCAACTGG TGGAACTGGC GGGCGGCGAC 
GACGAGATGA TAACCGGCGT TCTCGCTCAT GAGATCGGCC ATGTCGAATA CAAGCACAGC 
CTCCGGCAGC TTTATCGCGC CGCAGGCGTT GCCGGTCTTG TCATGCTGAT TGCCGGCGAT 
GTCGGCTCGG GCGTCGAGGA TATCCTGACG CAGGGTGGCG GGCTGCTGGC CTTGTCCTAT 
TCACGCGGTG CGGAGGCCGA GGCCGACCGG CGCTCGGTGG AACTGATGCG CAAGGCCGGC 
ATGGATCCTG TTGCGATCGC CCGTTTTTTC GATGTCTTGG AAGCCAAGCT CGGCGATCAT 
GCCAGCACCA GCATGCTATC GACCCATCCA GGCACCCCCG AACGCAAGCA GGCGATTTTG 
GAATATGACC GGATCCTGCA GCAGGATTGA

Protein sequence

MVSDAETVAK GEWYPPHSSG SVPARLLSRG GRLLAVTDED VALSDSAAGE LSFTPRVGSI 
PRRAVFADGS VFESSDNDAI DAFLRGGGRS GWVHRLEEFH PRIFVFAVAV VLLAVGIYRY 
ALPVLVEVAV LVTPPVVSEA MSYSALNTLD RTALSASQLD EARQAEIAAR FRQVAANAEG 
GAGRYVLNFR DGGLIGPNAF ALPDGNIVIT DQLVELAGGD DEMITGVLAH EIGHVEYKHS 
LRQLYRAAGV AGLVMLIAGD VGSGVEDILT QGGGLLALSY SRGAEAEADR RSVELMRKAG 
MDPVAIARFF DVLEAKLGDH ASTSMLSTHP GTPERKQAIL EYDRILQQD