Gene Rleg_6520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6520
Symbol
ID	8017104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	-
Start bp	234515
End bp	235657
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	63%
IMG OID	644828307
Product	peptidase M24
Protein accession	YP_002979507
Protein GI	241554294
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.180886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTGGC AGCACCCCGT ACCCCGCATC ACTGAGGACG AACGGCAGAA CCGCCTCGCC 
GGGCTTCGGA AACTGATCGA AGCCGAAGGA TTGGCTGCCG TGCTTCTTGG GCCGACCGAA 
AGCCTCCACT ACTTCACCGG GCTCGTCTGG CATCCGAGCG AAAGGTTCCT CGGCGCGCTC 
GTCATGCCCG CGACCATTTC CTACATCGTT CCGGGGTTCG AGCGCAGCCG TGTCGAAACG 
CTGCCACATC TGCCGGGGGA AATCCTGGTC TGGGAAGAGG AGGAGAGCAG CGCCGCTCTC 
ATCGCCCGCC TTGTTGCCCA GCGCGGCAGA CTTGCCCTCG ACGATGGCTT GCCGCTTTTC 
TTCTATCACG CATTGGCAGC GGAGATGGGC GCGGCAAGGC TTGCCGATGG CGGGCGGCTG 
ATCCGCGACC TGCGTTGCAT CAAATCGGCT GCAGAGCTTG CCCTCATTCA GTATGCGATG 
GACCTGACGC TCGACGTCCA CAAGCAAGTG CATGGGCTTT TGAAGCCGGG CATCAAATCA 
TCCGAGGTGG TCGAATTCAT CGACCGACAG CATCGCCAGG CCGGCGCCGA TGCCGGCTCG 
ACGTTCTGCA TCGTCTCCTT CGGCGCGGCG ACCTCGCTTC CGCATGGCGC CGACGGCGAT 
CAGGTCCTTG GTCGCGACGA CGTCGTTCTC GTCGATACCG GCTGCCGGAT CGACGGTTAT 
CATTCCGATA TCACCAGGAC CTATATTCTG GAGGACGGCA ACAGCGCGTT CGAACGCGCC 
TGGTGGATCG AGCGCGAGGC GCAACAGGCC GTCTTCGACG CAGCCCGGAT CGGCGCCGCC 
TGCTCGAGCC TCGACGATGC GGCCCGCAAG GTGCTTGCCA AACACTCGCT AGGCCCCGAC 
TATCGCCTGC CGGGTTTGCC GCATCGCGCC GGTCATGGCC TCGGGCTCGA GATCCACGAG 
GAGCCATACA TCGTTCGCGG CAACGACGCG CCGCTTGCCG CCGGCATGTG TTTTTCCAAT 
GAACCGATGA TCGTCTTCCC CGGGAAATTC GGGATCCGGT TGGAAGACCA TATCTACATG 
ACCGCCGAGG GACCACGCTG GCTGACCAAT CCAGCGGCGG GACCGACAAA GCCATTCTCC 
TGA

Protein sequence

MSWQHPVPRI TEDERQNRLA GLRKLIEAEG LAAVLLGPTE SLHYFTGLVW HPSERFLGAL 
VMPATISYIV PGFERSRVET LPHLPGEILV WEEEESSAAL IARLVAQRGR LALDDGLPLF 
FYHALAAEMG AARLADGGRL IRDLRCIKSA AELALIQYAM DLTLDVHKQV HGLLKPGIKS 
SEVVEFIDRQ HRQAGADAGS TFCIVSFGAA TSLPHGADGD QVLGRDDVVL VDTGCRIDGY 
HSDITRTYIL EDGNSAFERA WWIEREAQQA VFDAARIGAA CSSLDDAARK VLAKHSLGPD 
YRLPGLPHRA GHGLGLEIHE EPYIVRGNDA PLAAGMCFSN EPMIVFPGKF GIRLEDHIYM 
TAEGPRWLTN PAAGPTKPFS