Gene Rleg2_4910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4910
Symbol
ID	6978004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	551995
End bp	552996
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	62%
IMG OID	643394067
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_002278885
Protein GI	209546967
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TACTTGCATC GACGTGTTTG ACGTTCGGCC TGATCGGCGG CGCGTCATTC 
GCCAGCGCCG CCGAATGCGG CAGCGTCACC ATCGCCAGCA TGAACTGGCA GAGCGCCGAA 
GTTCTCTCCA ACCTGGACAA GTTCATTCTG AACGAAGGCT ATGGCTGCAG TGCTGACATC 
ACCGTCGGCG ACACCGTCCC GACGATCACC TCCATGGCCG AAAAGGGTCA GCCGGACATC 
GCGCCCGAAG CCTGGATCGA TCTGCTGCCC GACGTCGTCA AGAAGGGCAC GGAAGAAGGC 
CGCATCGTCC AGGTCGGCTC GCCGCTGCCC GATGGCGGCG TACAGGGCTG GTGGATTCCG 
AAGTATCTCG CCGATGCCCA TCCCGACATC AAGACGATCG GCGACGTGCT GAAGCATCCG 
GAGCTCTTCC CCGATCCCGA GGACCCGAAG AAGGGCGCCA TCGTCAATGG CCCGCAGGGC 
TGGGGCGGCA CTGTCGTCAC CTCGCAGCTC TACAAGGCCT TTGAGGCCGA GAAGGCGGGC 
TTCACCCTCG TCGACACCGG CTCTGCCGCC GGCCTCGACG GTTCGATCGC CAAGGCCTAC 
GAACGCAAGG AAGGCTGGGC CGGCTATTAC TGGGCGCCGA CCGCCCTGCT CGGCAAGTAT 
CAGATGGTCA AGCTCGAAGC CGGCGTGCCG GAGGATTCCG CCGAATGGAA GCGCTGCATC 
ACCGTCGCCG ACTGCCCCGA CCCGAAGCCC GCTTCGTGGC CGGTCGATCA TGTCGTCACC 
CTGGTTGCCA AGCCCTTCTC GGAAAAGGTC GGGCCTGAAG TCATGGACTA CCTGGCGAAG 
CGCTCCTGGA GCAACGACAC GGTCAACAAG CTGATGTCGT GGATGACCGA CAACCAGGCG 
ACCGGCGAAG ACGGCGCCAA GCACTTCCTG AAAGAAAACA AGGACATCTG GTCCAAGTGG 
GTTTCGCCGG AGGCAGCCAC GAAGATCGAA GCTGCCCTTT AA

Protein sequence

MKKLLASTCL TFGLIGGASF ASAAECGSVT IASMNWQSAE VLSNLDKFIL NEGYGCSADI 
TVGDTVPTIT SMAEKGQPDI APEAWIDLLP DVVKKGTEEG RIVQVGSPLP DGGVQGWWIP 
KYLADAHPDI KTIGDVLKHP ELFPDPEDPK KGAIVNGPQG WGGTVVTSQL YKAFEAEKAG 
FTLVDTGSAA GLDGSIAKAY ERKEGWAGYY WAPTALLGKY QMVKLEAGVP EDSAEWKRCI 
TVADCPDPKP ASWPVDHVVT LVAKPFSEKV GPEVMDYLAK RSWSNDTVNK LMSWMTDNQA 
TGEDGAKHFL KENKDIWSKW VSPEAATKIE AAL