Gene Smed_3603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3603
Symbol
ID	5318437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	31108
End bp	32136
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	59%
IMG OID	640775417
Product	putative ABC transporter periplasmic sugar-binding protein
Protein accession	YP_001312350
Protein GI	150375754
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCAATT TTCTCAGCAC GACCGCAATG GCGGTCCTAG CAACCACGCT TTTTTCCGGC 
GCGGCCGCAG CCGCGGCGGA AAACCCGTTC CGCTGCAAAC CGGGCGAAAA ATACGTCATG 
AACGTGATGG TATCCGGCGT CGAATACTGG TTCCCGGTTT ACGAGATGTT CAAGCAGGCC 
GGACAGCAGT TCGGCTGCGA GACGGAATAC ACCGGAACGC CGGAATATGA CGTCAACAAG 
CAGATCGCCA GCTTCGACCA GGCGCTCGCC CAGAACCCAG CCGGCATCCT GGTTCACCCG 
ATGAACTCCG ATCCGTTCAT CGAACCCATC AACCGGGCGA CCGACCAGGG CACGGCGGTC 
GTGACCTTCG CCGCCGACTC GCCCCTGTCC AAGCGCGTTT CCTACATCAC TTCAGACAAT 
ACCCGCGAGG GGATCTACGC CGCAGACAAG ATCGCCGAAA AGCTCGGCGG CAAGGGCGAA 
TATGCCGTGC TCGAAAATCC CGGCCAGGAC AATCATGACA AGCGCATCGC CGCCTTCATC 
GGCCGCATGG AGGAGAAATG GCCCGACATG AAGCTCGTCG GCCGCGCCGC CTCCAACCAG 
GACCCTAACA AGGCCTATCA GGGCCTTACG AGCCTTATCC AGGCAAACCC GAACCTTAGC 
GCCGTCTTCA TGCCCGAAGC AAATTCGGCG ATCGGTGCGG CACAGGCGAA CAAGGAAACC 
GGCGGCAAGG TGCTCGTCAT GTGCGCCGAC GTCAACGCCA ATATCCTCGA CATGATCAAG 
GCGGGAGAGG TCTTCGGATC GATCAATCCG AACCAGGGCA TGCAAGGCTA TATGGGCTTC 
CTCATGCTCT GGCTGGCCAA ACATCCGGAG CTGATAGACC CGATGAACGA CGCCAAGCGT 
TCCGGTTTCA ATCCGATGAG CATTCCCGTC GTCGACAACG GCCTGTCGAT CGTTACCGCC 
GAAAACGCAG ACGATTTCTA CTGGGACAAA TACCTGAAGC GCCGCGGCAC CAAAGGTATC 
GAGGAATAA

Protein sequence

MRNFLSTTAM AVLATTLFSG AAAAAAENPF RCKPGEKYVM NVMVSGVEYW FPVYEMFKQA 
GQQFGCETEY TGTPEYDVNK QIASFDQALA QNPAGILVHP MNSDPFIEPI NRATDQGTAV 
VTFAADSPLS KRVSYITSDN TREGIYAADK IAEKLGGKGE YAVLENPGQD NHDKRIAAFI 
GRMEEKWPDM KLVGRAASNQ DPNKAYQGLT SLIQANPNLS AVFMPEANSA IGAAQANKET 
GGKVLVMCAD VNANILDMIK AGEVFGSINP NQGMQGYMGF LMLWLAKHPE LIDPMNDAKR 
SGFNPMSIPV VDNGLSIVTA ENADDFYWDK YLKRRGTKGI EE