Gene Rleg_5371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5371
Symbol
ID	8007329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	780835
End bp	782259
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	62%
IMG OID	644822275
Product	peptidase M24
Protein accession	YP_002973535
Protein GI	241113700
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.56285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATGC ACGCGACAAA CGCAGGCGGC TATCGGATGG GATCGCTGCT GGCCGATTTC 
CAGCCGGATT TCGATTTCTC CGCGCCGCTG CCGCTTGCTG TCGAAGAGTT CGAGGACCGC 
CTTCGCCGAA TTCGCCGTCA GGCGATCGAA GCCGGTCATG ACGCGCTGAT CGTCCATGCC 
GGCAGCGTCG GCTGGTTCCA CGCTTCGAAC GCCTATCTGC GCTATATTTG CGACTGGATG 
CGCGAAGGCG TGCTGATCAT CCCGACCGAC GCCGACAAGG CGATGGTGCT TCTGTCCTTC 
TTCACCCAAT CCGTCCTGCT TCCGCCGGGC GGCGAGCCTG TGCTCGTCGA CGAAATCTGG 
CAGATCGGTC CGATCGGCCG CGAATATGCC GACCGCCCCG GCGATTCCGT CATCAAGACT 
GCCGAGAAAT GCGCCGAGGT TCTCGCCAGT CTCGGCCTCA CCAAGGCCCA GATCGGCAGG 
ATCGGCGACC GCACGTCGCT GACCTTCTGG TCTGCACTCG AGGAATTGAT GCCGAAGAGC 
AAGTTCGTGG CTGACAACGC CATTCTCGAC CGCATGCAGA AGGTCCGCTC GACGCGCGAG 
ATCGAGATCT TCCGCGCCGC CGCCCAGCTG ATCAGCATCG GCACGCAGGC TGCCTATCAT 
GTGGCAAAAT CAGGCGTGAC CGACCATGAA ATCCTCGCCG CCTTCACCTA TGCGCAGATG 
GCACTCGGCG GCGAAACCGG CGACGGCTAC CAGATCGGCA TCAACGAATT CGGCACCCAT 
TGCGGCAAGC CCTATGGCCA CATCGTCCGC CCAGGCGACC TCATCAACCT CTACATCTCC 
AACGTCACCT ATCGCGGCTA TACCGCCCAG ACCGCCCGCA TGATCGCGAT TGGTGACATC 
ACCAGCCGTC AGGAGGAGGT GCTTGCCGCC TGCACCGAGG GCGTCAAGCG GGCCGAAAAG 
CTCATCAAGC CCGGCGCCTT GATGCGCGAC GTCAACAATG CTGCCTTTGA ACCGATGATC 
GAGCGCGGCA TGCTCACCTC ACCCGAGGCA CGCACGATGC CCTATAACTG GTCGCCGATG 
GAAGACGGCG GGGCACGCCT GATCCCCAAT CAGTATGTGA AGGACATCGA CTGGGAGGCG 
CAGGGCCGCA AGCTCATGCA CGTCTATCCG GCAACGCACG GACCGCACAA TCCAAACCTC 
GGCCATTCGG TCGGCATGGC TGGTGGCCAG AACAGCTTCA ACATCTCCTC ACATAACTAC 
GACAGGATGG AGGAGGGCAT GGTCTTCGTG CTGCACACGC AGTGGCTGGA ACCGCTGTCG 
GCCGGCTGCA ATATCGGCGA CATGTATGTC GTGACCAAGG ACGGCTTTGA GAACCTCAGC 
CGCCATACCC CGCTTGAAAC CCGCCGCGTC GCTGCCGAGG CCTGA

Protein sequence

MNMHATNAGG YRMGSLLADF QPDFDFSAPL PLAVEEFEDR LRRIRRQAIE AGHDALIVHA 
GSVGWFHASN AYLRYICDWM REGVLIIPTD ADKAMVLLSF FTQSVLLPPG GEPVLVDEIW 
QIGPIGREYA DRPGDSVIKT AEKCAEVLAS LGLTKAQIGR IGDRTSLTFW SALEELMPKS 
KFVADNAILD RMQKVRSTRE IEIFRAAAQL ISIGTQAAYH VAKSGVTDHE ILAAFTYAQM 
ALGGETGDGY QIGINEFGTH CGKPYGHIVR PGDLINLYIS NVTYRGYTAQ TARMIAIGDI 
TSRQEEVLAA CTEGVKRAEK LIKPGALMRD VNNAAFEPMI ERGMLTSPEA RTMPYNWSPM 
EDGGARLIPN QYVKDIDWEA QGRKLMHVYP ATHGPHNPNL GHSVGMAGGQ NSFNISSHNY 
DRMEEGMVFV LHTQWLEPLS AGCNIGDMYV VTKDGFENLS RHTPLETRRV AAEA