Gene Rleg_1742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1742
Symbol
ID	8012806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1736478
End bp	1737548
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	66%
IMG OID	644824332
Product	Peptidase M15A
Protein accession	YP_002975567
Protein GI	241204471
COG category	[S] Function unknown
COG ID	[COG3108] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000376247
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.422133
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTTAACA TGCAGATGCG GATGCCCGTG ACGGGCGCTT TGCTGATCGC CACCTCGGTG 
CTGGCGCTGT CCGGCTGCGC GTCGGACAAG AAGGCGCTCG ATTCGGCGGC GGCGGTTCCG 
GCGGTGCAAG CCGCAGCAGC ACCGCAGCTC GCCACGGCAG CGCCTGCAAG CCCTGCCCCA 
CGTTCGGTCT ATAGCGATCC CCGGCTGGTC AACGTCTCCG GCGCCCAAGG CGCGCCTCAG 
GTCGTAGCAC CAGATCCGAA TGCAGCCGTC CCGCCCGCCG GTTCGGCAAC GGCGGCGCCC 
GCCAATATCG GCGGGCTCGT CCTGCAGTCG ACCCGGATCA ACGCGCAGGC GATGAGCATC 
TTTTCCGATC ACCAGCCGGC GCCGCAGAAC AACAGCACGT CCACGATCAT TCAGCCGCAG 
GCCTATGTGC CGGTGGAAGG TGCAGCACCG TCGCGAAGCA GCGTCTACAG CCAGCCGCCC 
GTGCCCCAGC AGCCGGCGGA GCCGGTGCTG CCGCAGCAAT CCTCACAGAA TAGCAGCACG 
CAGCTTGCGC CCGTGCAGAC AGCGTCGTTG GCGACGGGCA GCATTCCCAC CTCGACGATG 
AACGCGCTCT ACAGTGCGCC GAAGCAGAAC CTGCTTGGCA GCCTTTCCGG CCTGCTGCAC 
AAGGCGGCCC TGCCCGGCAT GACGCGCATC GCGCCGAACA GGCTGCATCT CCAGAACGAC 
AAGGTCGAGG TCGGCTGCTT CAAGCCCGAC CTGCTGAAAG TGATCAAGAC GGTCGAAAGC 
CATTTCGGCC GGCCTGTCAT CGTCACTTCC GGCTATCGCG ACGAAGAGCA CAACCGCCTC 
GCCGGCGGCG CCGACGAATC GATGCACAAG AGCTGCGAGG CCGCCGACAT CCAGATCGAC 
GGCGTGACGA AATGGGACAT CGCCGCCTAT ATCCGCTCGT TGCCGGACCG CGGCGGCGTC 
GGCACCTACT GCCACACGGA TTCGGTTCAC CTCGATACCG GCAAAACCCG TGACTGGAAC 
TGGGGCTGCG GCGGCAAACG GGCGCCGATC ACGACGGCAA GAGCGATCTG A

Protein sequence

MLNMQMRMPV TGALLIATSV LALSGCASDK KALDSAAAVP AVQAAAAPQL ATAAPASPAP 
RSVYSDPRLV NVSGAQGAPQ VVAPDPNAAV PPAGSATAAP ANIGGLVLQS TRINAQAMSI 
FSDHQPAPQN NSTSTIIQPQ AYVPVEGAAP SRSSVYSQPP VPQQPAEPVL PQQSSQNSST 
QLAPVQTASL ATGSIPTSTM NALYSAPKQN LLGSLSGLLH KAALPGMTRI APNRLHLQND 
KVEVGCFKPD LLKVIKTVES HFGRPVIVTS GYRDEEHNRL AGGADESMHK SCEAADIQID 
GVTKWDIAAY IRSLPDRGGV GTYCHTDSVH LDTGKTRDWN WGCGGKRAPI TTARAI