Gene EcolC_0997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0997
Symbol
ID	6067723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1083081
End bp	1084538
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	56%
IMG OID	641600405
Product	PTS system cellobiose/arbutin/salicin-specific transporter subunits IIBC
Protein accession	YP_001723993
Protein GI	170019039
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.013891
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAA ATTATGCGGC GCTGGCACGC TCGGTGATAG CGGCACTGGG CGGCGTTGAT 
AACATCTCGG CGGTCACGCA CTGTATGACG CGGTTGCGCT TTGTTATCAA AGATGATGCG 
CTTATCGACA GCCCGACGTT AAAAACCATC CCCGGCGTGC TCGGCGTGGT ACGTAGTGAC 
AACCAGTGTC AGGTGATTAT CGGCAATACC GTTTCACAAG CCTTTCAGGA AGTCGTCAGC 
CTGCTGCCGG GAGATATGCA GCCCGCACAG CCCGTGGGTA AACCCAAACT CACGCTACGT 
CGCATTGGTG CGGGGATCCT CGATGCGCTG ATCGGCACCA TGTCACCGCT GATCCCGGCG 
ATTATCGGCG GATCGATGGT CAAACTGCTG GCAATGATCC TCGAGATGAG CGGCGTGCTG 
ACAAAAGGAT CGCCGACCTT AACCATTCTG AATGTGATTG GTGACGGTGC TTTCTTCTTC 
CTGCCGCTGA TGGTCGCGGC ATCTGCCGCC ATCAAATTTA AAACCAATAT GTCGCTGGCG 
ATTGCCATCG CGGGTGTGCT GGTACATCCG AGTTTTATTG AACTGATGGC GAAAGCGGCC 
CAGGGTGAAC ATGTCGAATT TGCCCTGATT CCGGTCACCG CGGTGAAATA CACCTACACG 
GTGATCCCGG CGCTGGTGAT GACCTGGTGC CTGTCATATA TCGAACGCTG GGTGGACAGC 
ATTACACCGG CGGTGACCAA AAACTTCCTC AAACCAATGC TGATTGTGTT GATTGCCGCA 
CCGCTGGCAA TCCTGCTGAT TGGCCCGATT GGTATCTGGA TCGGTAGCGC CATTTCGGCG 
CTGGTTTACA CCATTCATGG TTATCTGGGC TGGCTTTCAG TCGCCATTAT GGGCGCGCTG 
TGGCCTCTGC TGGTAATGAC CGGGATGCAC CGCGTCTTTA CGCCAACCAT CATTCAGACC 
ATTGCCGAAA CCGGCAAAGA AGGGATGGTC ATGCCGTCAG AGATCGGCGC TAACCTGTCG 
CTGGGCGGTT CATCACTGGC AGTGGCGTGG AAAACGAAAA ACCCGGAACT GCGTCAGACG 
GCGCTGGCTG CGGCGGCATC AGCCATTATG GCGGGGATTT CCGAACCGGC GTTATATGGC 
GTGGCGATCC GCCTGAAACG TCCGCTTATC GCCAGTCTTA TCAGCGGTTT TATTTGCGGC 
GCGGTTGCCG GTATGGCGGG GCTTGCCAGC CACTCAATGG CAGCGCCGGG GCTATTTACC 
AGCGTGCAGT TCTTCGATCC GGCGAATCCA ATGAGCATCG TCTGGGTGTT CGCGGTCATG 
GCGCTGGCGG TGGTGCTGTC GTTTATCCTC ACACTGTTGC TCGGCTTTGA GGATATTCCT 
GTTGAGGAAG CGGCTGCCCA GGCGCGAAAG TATCAGAGCG TACAACCGAC CGTCGCCAAA 
GAAGTAAGTC TTAATTGA

Protein sequence

MAKNYAALAR SVIAALGGVD NISAVTHCMT RLRFVIKDDA LIDSPTLKTI PGVLGVVRSD 
NQCQVIIGNT VSQAFQEVVS LLPGDMQPAQ PVGKPKLTLR RIGAGILDAL IGTMSPLIPA 
IIGGSMVKLL AMILEMSGVL TKGSPTLTIL NVIGDGAFFF LPLMVAASAA IKFKTNMSLA 
IAIAGVLVHP SFIELMAKAA QGEHVEFALI PVTAVKYTYT VIPALVMTWC LSYIERWVDS 
ITPAVTKNFL KPMLIVLIAA PLAILLIGPI GIWIGSAISA LVYTIHGYLG WLSVAIMGAL 
WPLLVMTGMH RVFTPTIIQT IAETGKEGMV MPSEIGANLS LGGSSLAVAW KTKNPELRQT 
ALAAAASAIM AGISEPALYG VAIRLKRPLI ASLISGFICG AVAGMAGLAS HSMAAPGLFT 
SVQFFDPANP MSIVWVFAVM ALAVVLSFIL TLLLGFEDIP VEEAAAQARK YQSVQPTVAK 
EVSLN