Gene Rleg_4643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4643
Symbol
ID	8007122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	1520
End bp	2536
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	62%
IMG OID	644821580
Product	sugar ABC transporter, substrate-binding protein
Protein accession	YP_002972840
Protein GI	241113005
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCC GTAAGATGCT TCTGGCATCG GCCGCTATTG CTTGCGCCGC GATGCCCGTT 
TCCGCCTTTG CCGAGACATC GGCCAAGAAA ATCGCCCTTT CCAACAACTA TGCCGGCAAT 
TCGTGGCGCC AGGCCATGCT GACGAGTTGG GGCAAGGTGA CGGGCGAAGC CGTGAAGGCC 
GGCACCGTTG CCGCAGCCGA CCCTTTCACC ACCGCCGAGA ACCAGGCGAC GGAACAGGCC 
GCGCAGATCC AGAACATGAT CCTGCAGGGT TATGACGCCA TCGTGCTGAA CGCCGCCTCG 
CCGACGGCGC TGAACGGTGC GGTCAAGGAA GCCTGCGACG CCGGGATCAC CGTCGTGTCC 
TTCGATGGTA TCGTCACCGA ACCCTGCGCC TGGCGTATCG CCGTCAACTT CAAGGAAATG 
GGCCGCAGTG AGGTCGAGTA CTTATCGAAG AAACTTCCGG ACGGCGGCAA CCTGCTCGAG 
ATCCGCGGCC TTGCCGGTGT CTTCGTCGAC GACGAAATCT CGGCGGGCAT CCACGACGGT 
GTCAAGCAGT TCCCGCAGTT CAAGATTGTT GGCTCCGTTC ACGGCGACTG GGCGCAGGAC 
GTGGCGCAGA AGGCTGTTGC CGGCATCCTG CCGAGCCTGC CCGACATCGC CGGCGTCGTA 
ACGCAGGGCG GTGACGGCTA TGGCGCCGCA CAGGCGATTG CCGCAACCGA CCGGAAGATG 
CCGATCATTA TCATGGGCAA CCGCGAGGAC GAACTGAAGT GGTGGAAGGA GCAGAAGGAC 
GCGAAGAGCT ACGAGACCAT GTCCGTATCC ATCGCGCCAG GCGTCTCCAC ACTCGCTTTC 
TGGGTGGCCC AGCAGATCCT CGACGGTAAG GAAGTCAAGA AGGACCTCGT CGTGCCCTTC 
CTGCGCATCG ACCAGGACAA TCTCGAAACC AACCTCGCCA ATACCCAGGC CGGCGGCGTC 
GCCAACGTGG AATACACGCA GGCAGACGCA ATCAAGGTCA TCGAGTCCGC AAAGTAA

Protein sequence

MTIRKMLLAS AAIACAAMPV SAFAETSAKK IALSNNYAGN SWRQAMLTSW GKVTGEAVKA 
GTVAAADPFT TAENQATEQA AQIQNMILQG YDAIVLNAAS PTALNGAVKE ACDAGITVVS 
FDGIVTEPCA WRIAVNFKEM GRSEVEYLSK KLPDGGNLLE IRGLAGVFVD DEISAGIHDG 
VKQFPQFKIV GSVHGDWAQD VAQKAVAGIL PSLPDIAGVV TQGGDGYGAA QAIAATDRKM 
PIIIMGNRED ELKWWKEQKD AKSYETMSVS IAPGVSTLAF WVAQQILDGK EVKKDLVVPF 
LRIDQDNLET NLANTQAGGV ANVEYTQADA IKVIESAK