Gene EcHS_A1425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1425
Symbol
ID	5592338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1419359
End bp	1420651
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	50%
IMG OID	640920580
Product	putative sugar ABC transporter, periplasmic sugar-binding protein
Protein accession	YP_001458139
Protein GI	157160821
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAAT CAAAAATCGT GCTGTTATCA GCACTGGTTT CATGCGCCCT GATTTCAGGC 
TGTAAAGAAG AAAATAAAAC GAATGTATCC ATCGAATTTA TGCATTCTTC GGTGGAGCAG 
GAGCGCCAGG CCGTTATCAG TAAATTGATT GCCCGTTTTG AAAAAGAAAA CCCTGGCATC 
ACCGTTAAGC AAGTGCCCGT GGAAGAAGAT GCCTATAACA CTAAAGTCAT TACTCTTTCA 
CGTAGCGGTT CGCTGCCGGA AGTGATCGAA ACCAGCCATG ACTACGCCAA AGTGATGGAC 
AAAGAGCAGC TTATCGATCG CAAAGCGGTT GCCACAGTCA TCAGCAACGT TGGTGAAGGC 
GCGTTTTACG ATGGCGTACT GCGTATTGTG CGTACCGAAG ATGGTAGCGC ATGGACCGGT 
GTTCCTGTCA GCGCCTGGAT TGGCGGTATC TGGTATCGCA AAGATGTGCT GGCAAAAGCG 
GGGCTTGAGG AGCCGAAAAA CTGGCAACAG CTGCTGGACG TTGCACAGAA ACTGAATGAC 
CCGGCGAATA AAAAATACGG CATTGCGCTG CCTACAGCAG AAAGCGTGTT GACGGAACAA 
TCCTTCTCCC AGTTTGCGTT ATCCAACCAG GCTAACGTCT TTAACGCCGA AGGCAAAATC 
ACCCTTGATA CACCAGAGAT GATGCAGGCA CTGACCTATT ACCGCGACCT TGCTGCCAAC 
ACTATGCCGG GTTCTAACGA CATCATGGAA GTGAAAGACG CCTTTATGAA CGGCACCGCG 
CCGATGGCGA TTTACTCCAC CTATATCCTT CCGGCTGTGA TTAAAGAAGG CGACCCGAAA 
AACGTCGGTT TCGTGGTGCC AACCGAGAAA AACTCTGCGG TCTACGGCAT GTTGACCTCG 
CTGACCATTA CCGCCGGGCA AAAGACCGAA GAGACGGAAG CAGCAGAAAA ATTTGTCACC 
TTTATGGAGC AGGCAGACAA CATTGCCGAC TGGGTGATGA TGTCGCCAGG TGCTGCGCTG 
CCGGTGAATA AAGCGGTGGT GACTACCGCC ACCTGGAAAG ACAACGACGT TATTAAGGCG 
CTGGGTGAAC TACCGAATCA GCTAATCGGT GAACTGCCAA ATATTCAGGT TTTTGGCGCA 
GTAGGGGATA AAAACTTTAC CCGCATGGGT GATGTGACGG GTTCTGGCGT GGTGAGTTCA 
ATGGTGCATA ACGTCACCGT GGGTAAAGCC GATCTCTCTA CTACGCTGCA AGCGAGCCAG 
AAAAAACTGG ATGAACTGAT CGAACAGCAC TAA

Protein sequence

MIKSKIVLLS ALVSCALISG CKEENKTNVS IEFMHSSVEQ ERQAVISKLI ARFEKENPGI 
TVKQVPVEED AYNTKVITLS RSGSLPEVIE TSHDYAKVMD KEQLIDRKAV ATVISNVGEG 
AFYDGVLRIV RTEDGSAWTG VPVSAWIGGI WYRKDVLAKA GLEEPKNWQQ LLDVAQKLND 
PANKKYGIAL PTAESVLTEQ SFSQFALSNQ ANVFNAEGKI TLDTPEMMQA LTYYRDLAAN 
TMPGSNDIME VKDAFMNGTA PMAIYSTYIL PAVIKEGDPK NVGFVVPTEK NSAVYGMLTS 
LTITAGQKTE ETEAAEKFVT FMEQADNIAD WVMMSPGAAL PVNKAVVTTA TWKDNDVIKA 
LGELPNQLIG ELPNIQVFGA VGDKNFTRMG DVTGSGVVSS MVHNVTVGKA DLSTTLQASQ 
KKLDELIEQH