Gene Rleg_4493 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4493
Symbol
ID	8015255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4624891
End bp	4625886
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	644827069
Product	peptidase S58 DmpA
Protein accession	YP_002978270
Protein GI	241207174
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCGATC TTCTCAATCT CATCACCGAT ATCGAAGGTC TTTCCATCGG CCATGCGACC 
GACCTTGCGC TCGGTTCCGG CGTCACGGTC ATCGTCTTCG ACGAACCGGC CGTCGCATCC 
GGCACGGTGC TCGGCGGTGC GCCGGGCGGG CGCGACACCG GCCTGCTCGA TCCGTCGATG 
ACCGTCAATG CCGTGGATGC CTTCGTGCTC TCCGGCGGCT CGGCTTTCGG GCTGGATGCC 
GCCGGCGGCG TGCAGGCGGG CCTGCGCGAG CGCGGCCGCG GCTTTGCCGT CGGGTCGGTG 
CGCATCCCGA TCGTGCCGCA GGCGATCCTG ATGGACCTGC TGAATGGCGG CGACAAGGAT 
TGGGGCCTTC ACTCCCCCTA TCGCGACATG GGCTATACGG CACTGCAGGC TGCGGCCAAG 
GGCACATTCG CGCTCGGCAC GACAGGTGCA GGCACAGGGG CGACGACGGC CACCGTCAAG 
GGCGGGCTCG GCTCGGCCAG CGCCGTCAGC AGCACCGGGC ATCGCATCGC GGCGATCGTC 
GCAGTCAATG CGCTCGGCTC CGCAACGATC GGCGACGGGC CGCATTTCTG GGCAGCACCT 
TTCGAAAAAG ACGCGGAATT CGGCGGGCTC GGCATGCCTG ATGTGGCCGA CCACCGGATG 
CGGCTCAAGG GCATGAACAC GCCGGCAACG ACGATCGGCG CGGTGGTGAC CGACGCGCAG 
CTGACGAAGG CCGAGGCGCA CAGGCTTTCG CTCGCCGGCC ATGACGGCCT TGCCAGGGCA 
CTGCTGCCAG CGCACCTGCC ACTCGACGGT GATACCGTCT TTGCCGCTTC GACGGCCAAG 
CATCGAAGAG ACGACATGGC GAGCCTGATG GAGCTTTGCC ACCTTGCGAC CATCGTCATG 
GCGCGGGCGA TCGCCCGTGG CGTCTACGCG GCGACCGCCC TTCCGGTCGA GGGCGCGCAA 
ATGGCATGGC GCGACCGCTA TCCGAATGGT CGTTGA

Protein sequence

MPDLLNLITD IEGLSIGHAT DLALGSGVTV IVFDEPAVAS GTVLGGAPGG RDTGLLDPSM 
TVNAVDAFVL SGGSAFGLDA AGGVQAGLRE RGRGFAVGSV RIPIVPQAIL MDLLNGGDKD 
WGLHSPYRDM GYTALQAAAK GTFALGTTGA GTGATTATVK GGLGSASAVS STGHRIAAIV 
AVNALGSATI GDGPHFWAAP FEKDAEFGGL GMPDVADHRM RLKGMNTPAT TIGAVVTDAQ 
LTKAEAHRLS LAGHDGLARA LLPAHLPLDG DTVFAASTAK HRRDDMASLM ELCHLATIVM 
ARAIARGVYA ATALPVEGAQ MAWRDRYPNG R