Gene Rleg2_2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2138
Symbol
ID	6980877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	2200398
End bp	2201393
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	59%
IMG OID	643396859
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_002281647
Protein GI	209549730
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0458223
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.188194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGT TTCTGATTCC AGCCGTCTTT GCCGCGGCCC TTTCTATCGT TGCGCCGGCC 
GAAGCTGCAG AGTGCGGCAA GGTGTCGATC GCCGAGATGA AATGGGCCTC GGCCGGTATT 
GCGGCAAATT TCGACAAGAT CATCCTGGAA AAGGGCTACG GCTGCTCGGT CACAATCGTC 
GACGGCGACA CGCTGCCGAC CTTCGCCTCG ATGAACGAGA AAGGCACTCC GGACATCGCC 
TCTGAATATT GGATCAATTC CGTCAGGGCC TTGCTCGATC AGGCCGTCAA CGCCGGACGG 
CTGGTGCAGG GAGCCGAGAT CCTGGCCGAC GGTGCGGTCG AGGGCTGGTG GATCCCGAAA 
TTCATCGCCG ACGCCAATCC CGACATCCGG TCGGTCGAAG ATGCGCTGAA ACATCCCGAA 
CTCTTCCCCG CCGAGGACGA TGCGTCGAAG GGCGCGGTCT ACAATTGTCC CCCCGACTGG 
AGCTGCCAGA TATCGACCAC TAATCTGTTC AAGGCGCTTG CCGCGGACAA GAAGGGCTTC 
GAACTCGTCG AAACCGGCAG CCCCGAACGG CTCGATGCCT CGATTGCCCG TGCCTTCGAA 
AACAAGGTCG GCTGGCTCGG TTATTATTGG GCGCCGACGG CCGTCCTCGG CAAATACGAC 
ATGACGCGGC TGAGCTTCGG CGTCGGCCAC AACAAGACCG AGTGGGACCG CTGCACGGCA 
GTTGCCGGCT GCATGAGGCC GGAACTCAAT TCCTACCCGG TATCGCGCGC CTTCACCTTG 
ATGACCAGGT CTTTTGCCAG CCGCTCAGGA CCTGTCACCA CCTATCTCAA AACCCGCAAA 
TGGGACAATC AGACGATCAA TCAGGTTCTC GCCTGGCAAG ACGAAAACCA CGAAAGCAAC 
GAGGATGCCG CCATCCATTT CCTTCGCAAT TACGAGGGTC TGTGGATGAA ATGGGTTCCG 
GCCGATGTAG CCGAAAAGGT CAAGGCGAGC TTATAA

Protein sequence

MKTFLIPAVF AAALSIVAPA EAAECGKVSI AEMKWASAGI AANFDKIILE KGYGCSVTIV 
DGDTLPTFAS MNEKGTPDIA SEYWINSVRA LLDQAVNAGR LVQGAEILAD GAVEGWWIPK 
FIADANPDIR SVEDALKHPE LFPAEDDASK GAVYNCPPDW SCQISTTNLF KALAADKKGF 
ELVETGSPER LDASIARAFE NKVGWLGYYW APTAVLGKYD MTRLSFGVGH NKTEWDRCTA 
VAGCMRPELN SYPVSRAFTL MTRSFASRSG PVTTYLKTRK WDNQTINQVL AWQDENHESN 
EDAAIHFLRN YEGLWMKWVP ADVAEKVKAS L