Gene Smed_2305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2305
Symbol
ID	5323166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2384946
End bp	2385902
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	60%
IMG OID	640791243
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_001327972
Protein GI	150397505
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.738548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.268073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAGGA CACTTTCTCG CGAATTCATG CTGGCAGGTG CCGTTTGCAT GGCAACCCTG 
ACCGCCGGAC CCGCATTCGC GGCGGAGCCG GAAAGCTGCG GTACGGTCCG CTTCTCCGAC 
GTCGGCTGGA CCGATATCAC AGCAACCACC GCGACCGCGA CGACCATCCT CGAAGCGCTC 
GGTTACGAGA CGGACGTGAA GGTTCTGTCG GTGCCCGTTA CCTACACCTC GCTGAAGAAC 
AAGGACATCG ACGTCTTTCT CGGCAACTGG ATGCCGACCA TGGAAGCGGA CATCGCCCCC 
TATCGCGAAG ACAAGTCCGT CGAGACGGTA CGCGAGAACC TCGCAGGTGC GAAATACACG 
CTTGCGACAA ATGCCAAGGG CGCGGAGCTC GGCATCAAGG ACTTCAAGGA TATCGCCGCG 
CACAAGGAGG AGCTCGACGG CAAGATCTAC GGGATCGAGC CGGGCAATGA CGGCAACCGC 
CTGATCATCG ACATGGTCGA AAAAGGCACT TTCGATCTCA AGGGCTTCGA AGTCGTCGAA 
TCTTCCGAGC AGGGCATGCT CGCGCAGGTC GCCCGCGCTG AAAAATCCGG CGACCCGATC 
GTTTTTCTCG GATGGGAGCC GCATCCGATG AACGCGAATT TCAAGCTCAC CTATCTATCC 
GGTGGCGATG ACGTGTTCGG CCCCGACTAC GGTGGCGCCA CCGTGCATAC CAATGTGCGC 
GCCGGCTACA CGACCGAATG CCCCAATGTC GGCAAGCTTC TCCAAAACCT CTCGTTTTCG 
CTCCAGATGG AGAACGAGAT CATGGGCAAG ATCCTGAACG ATGGCGAAGA CCCGGAAAAG 
GCTGCAGCTT CGTGGCTGAA GGACAATCCG CAAGCAATCG AACCGTGGCT TGCGGGGGTC 
ACCACGAAGG ACGGCGGCGA TGGGCCGGCC GCCGTCAAGA GCGCGCTGGG CCTCTGA

Protein sequence

MIRTLSREFM LAGAVCMATL TAGPAFAAEP ESCGTVRFSD VGWTDITATT ATATTILEAL 
GYETDVKVLS VPVTYTSLKN KDIDVFLGNW MPTMEADIAP YREDKSVETV RENLAGAKYT 
LATNAKGAEL GIKDFKDIAA HKEELDGKIY GIEPGNDGNR LIIDMVEKGT FDLKGFEVVE 
SSEQGMLAQV ARAEKSGDPI VFLGWEPHPM NANFKLTYLS GGDDVFGPDY GGATVHTNVR 
AGYTTECPNV GKLLQNLSFS LQMENEIMGK ILNDGEDPEK AAASWLKDNP QAIEPWLAGV 
TTKDGGDGPA AVKSALGL