Gene Rleg2_2384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2384
Symbol
ID	6981123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	2445248
End bp	2446303
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	64%
IMG OID	643397097
Product	periplasmic solute binding protein
Protein accession	YP_002281885
Protein GI	209549968
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4531] ABC-type Zn2+ transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.691591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.896834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCA CCCTGGGCCC AGCCCTGAAG ATCCTGGCCT TTAAAATTCC GCTCGCCCTC 
GCCCTACCGG CGCTGGCGGT CCCCGCCTTG CTGTTTGCCG GCACCATGCG GGCCGCCGAC 
GCGCCTGTGG TCGTCACCTC GATCAAGCCG ATCCATTCGC TGGTTGCGGC GATCATGCAG 
GGTGTGGGCG AACCGGAGCT GATCGTCGAT GGCGCCGCCT CCCCGCATAC TTATAGCCTG 
AAGCCGTCGA ATGCGCGCGC GCTGCAGGAA GCCAAGGTGA TCTTCTGGAC CGGCCCCGGC 
CTCGAGACTT TCCTGGAAAA ACCGCTGCAG GCGCTGGGCT CGAAGGCCAG CATCGCCGAG 
CTCGATCATG CCCCCGGCCT CGTCAAGCTG CCCTTCCGCG AAGGCGGCGC CTTCGAGCCA 
CATGAGGATG GCGATGAGCA CCATGGCGCT TCCGCCGAGG GTGAGGATCA CGATCATGCA 
GCCGGCACCG GGCATGATGA CCATGATCAC GGACATGACG GTGACCATGA CCATGGCGCC 
TTCGACACGC ATCTCTGGCT CGACCCGATG AATGCCAAAG CCATGGCCGC CGTGATCACC 
ACGACGCTGG TCGCCGCCGA TCCCGCCAAT GCGCTGACCT ACCAGGCCAA TGCCAAGGCG 
CTGGACGACA AGCTGACGGC GCTGGATAAG GAAATCGCCG CCACCGTTGC TCCCGTCAAG 
GACAAGCCCT TCATCGTCTT CCACGACGCC TACCAGTACT TCGAGCATCG CTACGGCATC 
CGCGTCGCCG GCTCGATCAC CGTCAGCCCG GAAACCATTC CCGGTGCCGA GCGTGTTTCG 
GAAATCCACC GCAAAGTCGG CGAACTCGGC GCCACCTGCG TCTTTGCCGA ACCGCAATTC 
GAGCCGCGCC TCGTCAATGT CGTCATCGAA GGCACGAAGG CCAGATCCGG CGTGCTCGAC 
CCCGAAGCGG CAACGCTGAA GGCCGGCCCC GATCTCTACT TCACCCTCAT GCGCGGCATC 
GCCGAGAGCA TGAAGGATTG CCTCTCCAAC GCATGA

Protein sequence

MKRTLGPALK ILAFKIPLAL ALPALAVPAL LFAGTMRAAD APVVVTSIKP IHSLVAAIMQ 
GVGEPELIVD GAASPHTYSL KPSNARALQE AKVIFWTGPG LETFLEKPLQ ALGSKASIAE 
LDHAPGLVKL PFREGGAFEP HEDGDEHHGA SAEGEDHDHA AGTGHDDHDH GHDGDHDHGA 
FDTHLWLDPM NAKAMAAVIT TTLVAADPAN ALTYQANAKA LDDKLTALDK EIAATVAPVK 
DKPFIVFHDA YQYFEHRYGI RVAGSITVSP ETIPGAERVS EIHRKVGELG ATCVFAEPQF 
EPRLVNVVIE GTKARSGVLD PEAATLKAGP DLYFTLMRGI AESMKDCLSN A