Gene EcSMS35_3116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3116
Symbol	rafD
ID	6143148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3203317
End bp	3204747
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	51%
IMG OID	641617983
Product	raffinose invertase
Protein accession	YP_001745133
Protein GI	170683153
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID	[TIGR01322] sucrose-6-phosphate hydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0587653
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAGC GTCTTGCTTT GGCACAGTCT GCCCTTGAAA AACTTTGCGC ACGTCGTGGT 
AATGCCTGGT ACCCGATTTT TCATCTGGCT CCACCTGCCG GCTGGATGAA TGATCCAAAT 
GGCCTTATTT ACTTCAATGG GCGTTACCAT GCGTTCTTCC AGCATCATCC TGCAAGCGCA 
TATCAGGGGC CAATGCACTG GGGGCATGCC ACCAGTACCG ACATGTTGCA CTGGCAACAC 
GAACCTATCG CGCTGGCACC CGGAGATAAA TATGATCGTG ATGGCTGTTT TTCAGGGAGT 
GCCGTGGATG ATGATGGCGT GCTATCACTT ATTTATACTG GTCATATTTG TCTCGATGAT 
CGTGGTAATG ACAGCATTAT CCGTGAAGTA CAGTGTCTGG CTACAAGTCA TGATGGTATT 
CACTTTGAGA AGCAGGGCTG TGTGCTGACA CCTCCGGAAG GTATAATGCA TTTCCGTGAT 
CCCAAAGTCT GGCACGAAGA CGGCTCCTGG TGGATGGTCA TTGGTGCCCG GGACGCTTCT 
GACAATGGGC AAGTTCTGTT GTATCGCGGG ACATCTTTGC GGGACTGGCA TCTGGAGCAT 
GTTCTTGCTC ATTCCGCAGC CGGAAAAAGT TATATGTGGG AATGCCCCGA TTTCTTCAGG 
TGTGGTAATT TTCACTGGCT GATGTTCTCA CCACAGGGGA TGCCCCCTTC CGGTTATCGG 
TTCCGTAACC TTTTTCAGAG CGGTGTGTTG GCAGGGAGCT GGAAGCCTGG TTCTGTCTTT 
GCGCTGAAAG GGGGATTTGA AGAGCTGGAT TATGGTCATG ACTTTTATGC TCCACAGTCC 
ATGCTGGCTG AGGACGGCAG GCGTATCATT ATGGCATGGA TGAATATGTG GGATTCACCC 
GTGCCCACCC GCAGTGAAGC CTGGGCAGGA TGTCTGACGC TGCCCAGAGA GGTTTTTGAG 
CGCGATGGCC GGCTGTGCCA GCGACCTGTG CGTGAAGTCG AATCTCTGCG CAAAAAATGC 
CAGCCATTAT CCCCTGTAAG GTTACAGGGT TTGCAATTAC TGACCGAAAA TGTACAGGCC 
GCAGAATTAT TGGTGACGTG GCATACGGTT GACAGTCATG CGGAGCACTA TGGCGTCCGC 
CTTGGAGACG GTCTGCGACT TTATGTGGAT AATCAGGCCG GGCGATTGGT ACTGTGGCGC 
TATTACCCTG AGGAAGGGTT GGATGGTTAC CGCAGTGTTG AACTTCCTGA TACAGAATAT 
CTGACTCTTC GTATTTTCTT GGATCGTTCA TCTGTTGAAG TGTTTGTTAA CGATGGTGAG 
GCAACCTTAT CAAGTCGTAT TTATCCGCAA GCGGACTCGA GACAATTATC GTTATATGCC 
GCTCATGGCG ATGCGATATT AACTGATGGC ACTTTATGGA TGCTGACCTG A

Protein sequence

MKQRLALAQS ALEKLCARRG NAWYPIFHLA PPAGWMNDPN GLIYFNGRYH AFFQHHPASA 
YQGPMHWGHA TSTDMLHWQH EPIALAPGDK YDRDGCFSGS AVDDDGVLSL IYTGHICLDD 
RGNDSIIREV QCLATSHDGI HFEKQGCVLT PPEGIMHFRD PKVWHEDGSW WMVIGARDAS 
DNGQVLLYRG TSLRDWHLEH VLAHSAAGKS YMWECPDFFR CGNFHWLMFS PQGMPPSGYR 
FRNLFQSGVL AGSWKPGSVF ALKGGFEELD YGHDFYAPQS MLAEDGRRII MAWMNMWDSP 
VPTRSEAWAG CLTLPREVFE RDGRLCQRPV REVESLRKKC QPLSPVRLQG LQLLTENVQA 
AELLVTWHTV DSHAEHYGVR LGDGLRLYVD NQAGRLVLWR YYPEEGLDGY RSVELPDTEY 
LTLRIFLDRS SVEVFVNDGE ATLSSRIYPQ ADSRQLSLYA AHGDAILTDG TLWMLT