Gene Smed_4112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4112
Symbol
ID	5318547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	577735
End bp	578757
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	640775919
Product	putative sugar ABC transporter periplasmic sugar-binding protein ABC transporter
Protein accession	YP_001312852
Protein GI	150376256
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAAC TTATCGCATT TGCGCTTGGC ACCGTCGCTT CCATTGTGAT CGCAGCATCC 
GCTCACGCCG AGACCATCAA AATCGGTCTT TCGAACGGCT GGGTCGGTAG CGAGTGGCGT 
ACCCAAATGA TAGACGAGGC GAAGGCCGCG GCGGCGAAAT GGAAGGAGAA GGGGGTCGAC 
GTCGAGGTGT CCGTTCAGAG CGCCAATGTC GACGTGCCCG GGCAGATCGC GCATATCCGC 
AACTTCATCG CTGAAGGCGT CAATGCCATC ATCGTCAACC CTAATAGCCC GACCGCCTTC 
GATCCGATCT TCTCTCAGGC AAAGGAAGCC GGCATATTGG TGATCGCCAC CGATGCGGAA 
GTCTCGTCAC CGGATGCGAT CTACGTCGGC ATCGACCAGA CCGCCTGGGG TGCCGCGGGC 
GGCAAGTGGC TTGCCGAGAC GCTCGGTGGC AAGGGCAAGG TCGTCGCGAT CAACGGGGTC 
GCCGGTCATC CGGCGAACGA GATGCGCGTT GCAGGCTACA AGAGCGTCTT CAAGGATCAC 
CCTGACATCC AAGTCGTCAA TGAGGTCAAC GCCAATTGGG ACCAGGCGCA GGGGCAGCAG 
GCGATGCAGA ATATCCTTGC CACCTATCCC GACATCAACG GCGTGCTGGT TCAGGACGGC 
ATGGCGGCGG GCGCCTGGAA ATCGATCATG GATGCCGGCA AGACGGGCCA GATCGCCGCG 
ACCGGCGAGA TCCGCAAGGA CTTTATCGAC CTTTGGATCA AGCAAAAATT GAACTCCGGC 
GCGACCGTGA ACCCGCCGGG CGTCATGGCG AGCGCACTCA ACGTCGCCGT TCTGATGCTG 
CAGGGCAAGG AGCTGAAGGA GCCGGCGAAG GCCGGGCAAT ACGGCAATGC ACTCTATCTG 
CCGATCCCCT TCATCGACTC CAAGAACCTA GAGGAAGCCG CCAAGCAACT CGAGGGCAAG 
CCCGGCTATT ATTCCTATAC GAGTTCGCTT TCGATCGAGG AGGCGGAAGC GCTGTTCAAA 
TGA

Protein sequence

MRKLIAFALG TVASIVIAAS AHAETIKIGL SNGWVGSEWR TQMIDEAKAA AAKWKEKGVD 
VEVSVQSANV DVPGQIAHIR NFIAEGVNAI IVNPNSPTAF DPIFSQAKEA GILVIATDAE 
VSSPDAIYVG IDQTAWGAAG GKWLAETLGG KGKVVAINGV AGHPANEMRV AGYKSVFKDH 
PDIQVVNEVN ANWDQAQGQQ AMQNILATYP DINGVLVQDG MAAGAWKSIM DAGKTGQIAA 
TGEIRKDFID LWIKQKLNSG ATVNPPGVMA SALNVAVLML QGKELKEPAK AGQYGNALYL 
PIPFIDSKNL EEAAKQLEGK PGYYSYTSSL SIEEAEALFK