Gene EcHS_A2851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2851
Symbol	ascF
ID	5592198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2856942
End bp	2858399
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	56%
IMG OID	640921968
Product	PTS system cellobiose/arbutin/salicin-specific transporter subunits IIBC
Protein accession	YP_001459479
Protein GI	157162161
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAA ATTATGCGGC GCTGGCACGC TCGGTGATAG CGGCACTGGG CGGCGTTGAT 
AACATCTCGG CGGTCACGCA CTGTATGACG CGGTTGCGCT TTGTTATCAA AGATGATGCG 
CTTATCGACA GCCCGACGTT AAAAACCATC CCCGGCGTGC TCGGCGTGGT ACGTAGTGAC 
AACCAGTGTC AGGTGATTAT CGGCAATACC GTTTCACAAG CCTTTCAGGA AGTCGTCAGC 
CTGCTGCCGG GAGATATGCA GCCCGCACAG CCCGTGGGTA AACCCAAACT CACGCTACGT 
CGCATTGGTG CGGGGATCCT CGATGCGCTG ATCGGCACCA TGTCACCGCT GATCCCGGCG 
ATTATCGGCG GATCGATGGT CAAACTGCTG GCAATGATCC TCGAGATGAG CGGCGTGCTG 
ACAAAAGGAT CGCCGACCTT AACCATTCTG AATGTGATTG GTGACGGTGC TTTCTTCTTC 
CTGCCGCTGA TGGTCGCGGC ATCTGCCGCC ATCAAATTTA AAACCAATAT GTCGCTGGCG 
ATTGCCATCG CGGGTGTGCT GGTACATCCG AGTTTTATTG AACTGATGGC GAAAGCGGCC 
CAGGGTGAAC ATGTCGAATT TGCCCTGATT CCGGTCACCG CGGTGAAATA CACCTACACG 
GTGATCCCGG CGCTGGTGAT GACCTGGTGC CTGTCATATA TCGAACGCTG GGTGGACAGC 
ATTACACCGG CGGTGACCAA AAACTTCCTC AAACCAATGC TGATTGTGTT GATTGCCGCA 
CCGCTGGCAA TCCTGCTGAT TGGCCCGATT GGTATCTGGA TCGGTAGCGC CATTTCGGCG 
CTGGTTTACA CCATTCATGG TTATCTGGGC TGGCTTTCAG TCGCCATTAT GGGCGCGCTG 
TGGCCTCTGC TGGTAATGAC CGGGATGCAC CGCGTCTTTA CGCCAACCAT CATTCAGACC 
ATTGCCGAAA CCGGCAAAGA AGGGATGGTC ATGCCGTCAG AGATCGGCGC TAACCTGTCG 
CTGGGCGGTT CATCACTGGC AGTGGCGTGG AAAACGAAAA ACCCGGAACT GCGTCAGACG 
GCGCTGGCTG CGGCGGCATC AGCCATTATG GCGGGGATTT CCGAACCGGC GTTATATGGC 
GTGGCGATCC GCCTGAAACG TCCGCTTATC GCCAGTCTTA TCAGCGGTTT TATTTGCGGC 
GCGGTTGCCG GTATGGCGGG GCTTGCCAGC CACTCAATGG CAGCGCCGGG GCTATTTACC 
AGCGTGCAGT TCTTCGATCC GGCGAATCCA ATGAGCATCG TCTGGGTGTT CGCGGTCATG 
GCGCTGGCGG TGGTGCTGTC GTTTATCCTC ACACTGTTGC TCGGCTTTGA GGATATTCCT 
GTTGAGGAAG CGGCTGCCCA GGCGCGAAAG TATCAGAGCG TACAACCGAC CGTCGCCAAA 
GAAGTAAGTC TTAATTGA

Protein sequence

MAKNYAALAR SVIAALGGVD NISAVTHCMT RLRFVIKDDA LIDSPTLKTI PGVLGVVRSD 
NQCQVIIGNT VSQAFQEVVS LLPGDMQPAQ PVGKPKLTLR RIGAGILDAL IGTMSPLIPA 
IIGGSMVKLL AMILEMSGVL TKGSPTLTIL NVIGDGAFFF LPLMVAASAA IKFKTNMSLA 
IAIAGVLVHP SFIELMAKAA QGEHVEFALI PVTAVKYTYT VIPALVMTWC LSYIERWVDS 
ITPAVTKNFL KPMLIVLIAA PLAILLIGPI GIWIGSAISA LVYTIHGYLG WLSVAIMGAL 
WPLLVMTGMH RVFTPTIIQT IAETGKEGMV MPSEIGANLS LGGSSLAVAW KTKNPELRQT 
ALAAAASAIM AGISEPALYG VAIRLKRPLI ASLISGFICG AVAGMAGLAS HSMAAPGLFT 
SVQFFDPANP MSIVWVFAVM ALAVVLSFIL TLLLGFEDIP VEEAAAQARK YQSVQPTVAK 
EVSLN