Gene Rleg2_4203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4203
Symbol
ID	6982976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	4378060
End bp	4379055
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	69%
IMG OID	643398934
Product	peptidase S58 DmpA
Protein accession	YP_002283691
Protein GI	209551774
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCGATC TTCTCAACCT CATCACCGAT ATCGACGGCG TTTCCGTCGG CCATGCGACC 
GACCTTGCGC TCGGTTCCGG CGTCACGGTC ATCGTCTTCG ACGCGCCGGC CGTCGCATCC 
GGCACGGTGC TCGGCGGTGC GCCGGGCGGG CGCGACACCG GCCTGCTCGA CCCATCGATG 
ACCGTCAACG CCGTCGATGC CTTCGTGCTC TCCGGCGGCT CGGCTTTCGG GCTGGACGCC 
GCCGGCGGCG TGCAGGCCGG ATTGCGCGAA CTCGGCCGTG GCTTTGCGGT CGGGCCGGTG 
CGCATACCGA TTGTGCCGCA GGCGATCCTG ATGGATCTGC TGAACGGCGG CGACAAGGAT 
TGGGGGCTGC ACTCGCCCTA TCGCGACATG GGTTATGCCG CGCTGAAGGC CGCCGCCAAG 
GGCACATTCA CGCTCGGCAC CACAGGCGCC GGCACAGGGG CGACGACGGC CACCGTCAAA 
GGCGGGCTCG GCTCGGCCAG CGCCGTCAGC AGTGCCGGCC ATCGTGTCGC GGCGATCGTC 
GCCGTCAATG CGCTCGGCTC GGCAACGATC GGCGACGGAC CGCATTTCTG GGCGGCACCC 
TTCGAAAAAG ACGCAGAATT CGGCGGGCTC GGCATGCCTG CGATTGCCGA TCACAGGATG 
CGGCTCAAGG GAATGAACGG GCCGGCGACG ACGATCGGCG CGGTGGTGAC CGACGCGCAG 
CTGACCAAGG CCGAGGCGCA CCGGCTTTCG CTCGCCGGCC ATGACGGTCT TGCCCGGGCG 
CTGCTGCCGG CGCACCTGCC GCTCGACGGG GACACGGTTT TTGCCGCGTC GACGGCCAGG 
CATCGCCGAG ACGACATGGC AAGCCTGATG GAGCTTTGCC ATCTTGCCAC CATCGTCATG 
GCGCGGGCGA TCGCCCGCGG CGTCTATGCC GCTACCGCGC TGCCGGCCGA GGGCGCGCAA 
AAGGCGTGGC GCGACCGCTA TCCCGACGGT CATTGA

Protein sequence

MPDLLNLITD IDGVSVGHAT DLALGSGVTV IVFDAPAVAS GTVLGGAPGG RDTGLLDPSM 
TVNAVDAFVL SGGSAFGLDA AGGVQAGLRE LGRGFAVGPV RIPIVPQAIL MDLLNGGDKD 
WGLHSPYRDM GYAALKAAAK GTFTLGTTGA GTGATTATVK GGLGSASAVS SAGHRVAAIV 
AVNALGSATI GDGPHFWAAP FEKDAEFGGL GMPAIADHRM RLKGMNGPAT TIGAVVTDAQ 
LTKAEAHRLS LAGHDGLARA LLPAHLPLDG DTVFAASTAR HRRDDMASLM ELCHLATIVM 
ARAIARGVYA ATALPAEGAQ KAWRDRYPDG H