Gene ECH74115_2455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2455
Symbol	chbC
ID	6969569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2325661
End bp	2327019
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	49%
IMG OID	643386324
Product	PTS system N,N'-diacetylchitobiose-specific transporter subunit IIC
Protein accession	YP_002270806
Protein GI	209400404
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.7631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAATG TTATTGCATC GCTTGAAAAG GTACTCCTCC CTTTTGCAGT TAAAATAGGA 
AAGCAGCCAC ACGTTAATGC AATCAAAAAT GGCTTTATTC GCTTAATGCC GTTAACCCTT 
GCGGGGGCCA TGTTTGTATT AATTAACAAC GTTTTTCTAA GCTTTGGGGA GGGGTCGTTT 
TTTTATTCCT TAGGTATTCG CCTCGACGCC TCAACCATTG AAACACTTAA TGGTCTGAAA 
GGTATTGGCG GCAACGTATA TAACGGAACA TTAGGGATAA TGTCTTTAAT GGCACCGTTC 
TTTATTGGCA TGGCGCTGGC AGAAGAGCGT AAAGTCGATG CGCTGGCGGC TGGGTTGTTA 
TCCGTTGCAG CATTTATGAC CGTCACCCCA TATAGTGTCG GTGAGGCCTA TGCGGTTGGC 
GCAAACTGGT TAGGTGGGGC GAATATCATC TCCGGGATTA TTATTGGCCT GGTGGTGGCA 
GAAATGTTTA CCTTTATTGT CCGCCGCAAT TGGGTCATTA AACTGCCCGA CAGCGTACCT 
GCTTCAGTAT CGCGTTCCTT CTCGGCATTA ATTCCCGGCT TTATTATTCT TTCCGTGATG 
GGGATTATTG CCTGGGCGTT GAATACCTGG GGCACCAACT TCCATCAGAT CATTATGGAT 
ACCATCTCAA CCCCACTGGC ATCGTTGGGT AGCGTGGTGG GCTGGGCCTA TGTGATCTTT 
GTTCCACTGC TCTGGTTCTT CGGTATTCAT GGCGCGCTGG CGCTGACCGC ACTGGACAAC 
GGCATTATGA CGCCGTGGGC GCTGGAAAAT ATCGCGACCT ATCAGCAATA TGGTTCCGTC 
GAAGCGGCGC TGGCAGCCGG TAAGACCTTC CATATCTGGG CCAAGCCGAT GCTGGACTCC 
TTTATTTTCC TTGGAGGCAG TGGTGCGACT TTAGGCCTGA TCCTGGCTAT CTTTATTGCC 
TCTCGCCGTG CTGATTATCG TCAGGTGGCA AAACTGGCGC TGCCGTCCGG CATCTTCCAG 
ATTAACGAAC CGATTCTGTT TGGTCTGCCA ATTATCATGA ACCCGGTGAT GTTTATCCCG 
TTTGTACTGG TACAACCGAT TCTGGCGGCA ATCACCCTGG CAGCGTACTA CATGGGCATT 
ATTCCTCCGG TGACCAATAT TGCACCGTGG ACCATGCCAA CCGGTCTGGG AGCCTTCTTT 
AACACCAACG GTAGCGTCGT CGCATTGCTG GTTGCACTCT TCAACCTTGG TATCGCAACG 
TTAATTTATC TGCCCTTTGT TGTGGTGGCT AACAAAGCAC AAAATGCGAT TGATAAAGAA 
GAGAGCGAAG AAGATATCGC TAACGCCCTG AAATTTTAA

Protein sequence

MSNVIASLEK VLLPFAVKIG KQPHVNAIKN GFIRLMPLTL AGAMFVLINN VFLSFGEGSF 
FYSLGIRLDA STIETLNGLK GIGGNVYNGT LGIMSLMAPF FIGMALAEER KVDALAAGLL 
SVAAFMTVTP YSVGEAYAVG ANWLGGANII SGIIIGLVVA EMFTFIVRRN WVIKLPDSVP 
ASVSRSFSAL IPGFIILSVM GIIAWALNTW GTNFHQIIMD TISTPLASLG SVVGWAYVIF 
VPLLWFFGIH GALALTALDN GIMTPWALEN IATYQQYGSV EAALAAGKTF HIWAKPMLDS 
FIFLGGSGAT LGLILAIFIA SRRADYRQVA KLALPSGIFQ INEPILFGLP IIMNPVMFIP 
FVLVQPILAA ITLAAYYMGI IPPVTNIAPW TMPTGLGAFF NTNGSVVALL VALFNLGIAT 
LIYLPFVVVA NKAQNAIDKE ESEEDIANAL KF