Gene EcE24377A_2649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2649
Symbol
ID	5586160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2639787
End bp	2641229
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	51%
IMG OID	640926305
Product	sucrose-6-phosphate hydrolase
Protein accession	YP_001463698
Protein GI	157158158
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID	[TIGR01322] sucrose-6-phosphate hydrolase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAAA TGACGCAAAC TCGATTGCAT GCGGCGCAAA ACGCACTAGC AAAACTTCAT 
GAGCACCGGG GTAACACTTT CTATCCCCAT TTTCACCTCG CGCCTCCTGC CGGATGGATG 
AACGATCCAA ACGGCCTGAT CTGGTTTAAC GATCGTTATC ACGCGTTTTA TCAACATCAC 
CCGATGAGCG AACACTGGGG ACCAATGCAC TGGGGACATG CCACCAGCGA CGATATGATC 
CACTGGCAGC ATGAGCCTAT TGCGCTAGCG CCAGGAGACG ATAATGACAA AGACGGGTGT 
TTTTCAGGTA GTGCTGTCGA TGACAATGGT GTCCTCTCAC TTATCTACAC CGGACACGTC 
TGGCTCGATG GTGCAGGTAA TGACGATGCA ATTCGCGAAG TACAATGTCT GGCTACCAGT 
CGGGATGGTA TTCATTTCGA GAAACAGGGT GTGATCCTCA CTCCACCAGA AGGAATCATG 
CACTTCCGCG ATCCTAAAGT GTGGCGTGAA GCCGACACAT GGTGGATGGT AGTCGGGGCG 
AAAGATCCAG GCAACACGGG GCAGATCCTG CTTTATCGCG GCAGTTCATT GCGTGAATGG 
ACCTTCGATC GCGTACTGGC CCACGCTGAT GCGGGTGAAA GCTATATGTG GGAATGTCCG 
GACTTTTTCA GCCTTGGCGA TCAGCATTAT CTGATGTTTT CCCCGCAGGG AATGAATGCC 
GAGGGATACA GTTACCGAAA TCGCTTTCAA AGTGGCGTAA TACCCGGAAT GTGGTCGCCA 
GGACGACTTT TTGCACAATC CGGGCATTTT ACTGAACTTG ATAACGGGCA TGACTTTTAT 
GCACCACAAA GCTTTTTAGC GAAGGATGGT CGGCGTATTG TTATCGGCTG GATGGATATG 
TGGGAATCGC CAATGCCCTC AAAACGTGAA GGATGGGCAG GCTGCATGAC GCTGGCGCGC 
GAGCTATCAG AAAGCAATGG CAAACTTCTA CAACGCCCGG TACACGAAGC TGAGTCGTTA 
CGCCAGCAGC ATCAATCTGT CTCTCCCCGC ACAATCAGCA ATAAATATGT TTTGCAGGAA 
AACGCGCAAG CAGTTGAGAT TCAGTTGCAG TGGGCGCTGA AGAACAGTGA TGCCGAACAT 
TACGGATTAC AGCTCGGCAC TGGAATGCGG CTGTATATTG ATAACCAATC TGAGCGACTT 
GTTTTGTGGC GGTATTACCC ACACGAGAAT TTAGACGGCT ACCGTAGTAT TCCCCTCCCG 
CAGCGTGACA CGCTCGCCCT AAGGATATTT ATCGATACAT CATCCGTGGA AGTATTTATT 
AACGACGGGG AAGCGGTGAT GAGTAGTCGA ATCTATCCGC AGCCAGAAGA ACGGGAACTG 
TCGCTTTATG CCTCCCACGG AGTGGCTGTG CTGCAACATG GAGCACTCTG GCTACTGGGT 
TAA

Protein sequence

MIKMTQTRLH AAQNALAKLH EHRGNTFYPH FHLAPPAGWM NDPNGLIWFN DRYHAFYQHH 
PMSEHWGPMH WGHATSDDMI HWQHEPIALA PGDDNDKDGC FSGSAVDDNG VLSLIYTGHV 
WLDGAGNDDA IREVQCLATS RDGIHFEKQG VILTPPEGIM HFRDPKVWRE ADTWWMVVGA 
KDPGNTGQIL LYRGSSLREW TFDRVLAHAD AGESYMWECP DFFSLGDQHY LMFSPQGMNA 
EGYSYRNRFQ SGVIPGMWSP GRLFAQSGHF TELDNGHDFY APQSFLAKDG RRIVIGWMDM 
WESPMPSKRE GWAGCMTLAR ELSESNGKLL QRPVHEAESL RQQHQSVSPR TISNKYVLQE 
NAQAVEIQLQ WALKNSDAEH YGLQLGTGMR LYIDNQSERL VLWRYYPHEN LDGYRSIPLP 
QRDTLALRIF IDTSSVEVFI NDGEAVMSSR IYPQPEEREL SLYASHGVAV LQHGALWLLG