Gene EcE24377A_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3000
Symbol	ascF
ID	5590656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3000193
End bp	3001650
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	56%
IMG OID	640926648
Product	PTS system cellobiose/arbutin/salicin-specific transporter subunits IIBC
Protein accession	YP_001464024
Protein GI	157156159
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAA ATTATGCGGC GCTGGCACGC TCGGTGATAG CGGCACTGGG CGGCGTTGAT 
AACATCTCGG CAGTCACGCA CTGTATGACG CGTTTGCGCT TTGTTATCAA AGATGACCAG 
CTTATCGACA GCCCGACGTT AAAAACCATC CCCGGCGTGC TCGGCGTGGT ACGTAGTGAC 
AACCAGTGTC AGGTGATTAT CGGCAATACC GTTTCACAAG CCTTTCAGGA AGTCGTCAGC 
CTGCTGCCGG GAGATATGCA GCCCGTACAG CCCGTGGGTA AACCCAAACT CACGCTGCGT 
CGCATTGGTG CGGGGATCCT CGATGCGCTG ATCAGCACCA TGTCACCGCT GATCCCGGCG 
ATTATCGGCG GATCGATGGT CAAACTGCTG GCGATGATCC TCGAGATGAG CGGCGTGTTG 
ACAAAAGGAT CGCCGACCTT AACCATTCTG AATGTGATTG GTGACGGTGC TTTCTTCTTC 
CTGCCGCTAA TGGTCGCGGC ATCTGCCGCC ATCAAATTTA AAACCAATAT GTCGCTGGCG 
ATTGCCATCG CAGGTGTGCT GGTACATCCG AGCTTTATTG AACTGATGGC GAAAGCGGCC 
CAGGGTGAAC ATGTCGAATT TGCCCTGATT CCGGTCACCG CGGTGAAATA TACCTACACG 
GTGATCCCGG CGCTGGTGAT GACCTGGTGC CTGTCATATA TCGAACGCTG GGTGGATCGC 
ATTACACCGG CTGTGACCAA AAACTTCCTC AAGCCAATGC TGATTGTGTT GATTGCCGCA 
CCGCTGGCAA TCCTGCTGAT TGGCCCGATT GGTATCTGGA TCGGTAGCGC CATTTCGGCG 
CTGGTTTACA CCATTCATGG TTATCTGGGC TGGCTTTCAG TCGCCATTAT GGGCGCGCTG 
TGGCCTCTGC TGGTAATGAC CGGGATGCAC CGCGTCTTTA CGCCAACCAT CATTCAGACC 
ATTGCCGAAA CCGGCAAAGA AGGGATGGTC ATGCCGTCAG AGATCGGCGC TAACCTGTCG 
CTGGGCGGTT CATCACTGGC GGTGGCGTGG AAAACGAAAA ACCCGGAACT GCGCCAGACG 
GCGCTGGCTG CGGCGGCATC AGCCATTATG GCGGGGATTT CCGAACCGGC GTTATACGGC 
GTGGCGATCC GCCTGAAACG TCCGCTTATC GCCAGTCTTA TCAGCGGTTT TATTTGCGGC 
GCGGTTGCCG GTATGGCGGG GCTTGCCAGC CACTCAATGG CAGCGCCGGG GTTATTTACC 
AGCGTGCAAT TCTTCGATCC GGCGAATCCA ATGAGCATCG TCTGGGTGTT CGCGGTCATG 
GCGCTGGCGG TGGTGCTGTC GTTTATCCTC ACACTATTGC TCGGCTTTGA GGATATTCCT 
GTTGAGGAAG CGGCTGCCGA GGCGCGAAAG CATCAGAGCG CACAACCGAC CGTCGCCAAA 
GAAGTAAGTC TTAATTGA

Protein sequence

MAKNYAALAR SVIAALGGVD NISAVTHCMT RLRFVIKDDQ LIDSPTLKTI PGVLGVVRSD 
NQCQVIIGNT VSQAFQEVVS LLPGDMQPVQ PVGKPKLTLR RIGAGILDAL ISTMSPLIPA 
IIGGSMVKLL AMILEMSGVL TKGSPTLTIL NVIGDGAFFF LPLMVAASAA IKFKTNMSLA 
IAIAGVLVHP SFIELMAKAA QGEHVEFALI PVTAVKYTYT VIPALVMTWC LSYIERWVDR 
ITPAVTKNFL KPMLIVLIAA PLAILLIGPI GIWIGSAISA LVYTIHGYLG WLSVAIMGAL 
WPLLVMTGMH RVFTPTIIQT IAETGKEGMV MPSEIGANLS LGGSSLAVAW KTKNPELRQT 
ALAAAASAIM AGISEPALYG VAIRLKRPLI ASLISGFICG AVAGMAGLAS HSMAAPGLFT 
SVQFFDPANP MSIVWVFAVM ALAVVLSFIL TLLLGFEDIP VEEAAAEARK HQSAQPTVAK 
EVSLN