Gene Rleg2_5738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5738
Symbol
ID	6977128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	-
Start bp	138056
End bp	139072
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	63%
IMG OID	643393194
Product	putative sugar ABC transporter, substrate-binding protein
Protein accession	YP_002278012
Protein GI	209546122
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCC GCAAGATGCT TCTGGCATCG GCCGCTATTG CTTGCGCCGC GATGCCCGTT 
TCTGCCTTTG CCGACACGTC GGCCAAGAAA ATCGCTCTTT CCAACAATTA TGCCGGCAAC 
TCATGGCGCC AGGCCATGCT GACGAGCTGG GGCAAGGTGA CGGGCGAAGC CGTGAAGGCC 
GGCACCGTTG CCGCAGCCGA CCCTTTCACC ACCGCCGAGA ACCAGGCGAC GGAGCAGGCC 
GCGCAGATTC AGAACATGAT CCTGCAGGGC TATGACGCCA TCGTGCTGAA CGCCGCCTCG 
CCGACGGCAC TGAACGGCGC GGTCAAAGAA GCCTGCGATG CCGGCATCAC CGTGGTGTCC 
TTCGACGGCA TCGTGACCGA ACCTTGCGCC TGGCGCATTG CCGTCAACTT CAAGGAAATG 
GGCCGCAGCG AAGTTGAGTA CCTGTCGAAG AAACTCCCTG AGGGCGGCAA CCTGCTCGAG 
ATCCGCGGTC TTGCCGGTGT CTTCGTCGAT GACGAGATCT CGGCGGGCAT TCACGACGGC 
GTCAAGCAGT ACCCGCAGTT CAAGGTCGTC GGCTCCGTTC ACGGCGATTG GGCGCAGGAC 
GTGGCGCAGA AGGCGGTTGC CGGCATCCTG CCGAGCCTGC CCGACATCGT CGGCGTGGTG 
ACGCAGGGCG GCGACGGTTA TGGCGCCGCG CAGGCGATTG CGGCGACCGA CCGGAAGATG 
CCGACCATCA TCATGGGCAA CCGCGAAGAT GAACTGAAGT GGTGGAAGGA GCAGAAGGAC 
GGCAAGGGCT ACGAGACCAT GTCCGTGTCG ATCGCGCCCG GCGTCTCAAC ACTCGCCTTC 
TGGGTCGCTC AGCAGATCCT CGACGGCAAG GAGGTCAAGA AGGACCTCGT GGTGCCCTTC 
CTGCGCATCG ACCAGGACAA TCTCGAAACG AACCTCGCCA ATACCCAGGC CGGCGGCGTC 
GCCAACGTGG AATACACGCA GGCAGACGCC ATCAAGGTCA TCGAGTCGGC AAAGTAA

Protein sequence

MTIRKMLLAS AAIACAAMPV SAFADTSAKK IALSNNYAGN SWRQAMLTSW GKVTGEAVKA 
GTVAAADPFT TAENQATEQA AQIQNMILQG YDAIVLNAAS PTALNGAVKE ACDAGITVVS 
FDGIVTEPCA WRIAVNFKEM GRSEVEYLSK KLPEGGNLLE IRGLAGVFVD DEISAGIHDG 
VKQYPQFKVV GSVHGDWAQD VAQKAVAGIL PSLPDIVGVV TQGGDGYGAA QAIAATDRKM 
PTIIMGNRED ELKWWKEQKD GKGYETMSVS IAPGVSTLAF WVAQQILDGK EVKKDLVVPF 
LRIDQDNLET NLANTQAGGV ANVEYTQADA IKVIESAK