Gene EcHS_A1819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1819
Symbol	chbC
ID	5592104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1837938
End bp	1839296
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	49%
IMG OID	640920963
Product	PTS system N,N'-diacetylchitobiose-specific transporter subunit IIC
Protein accession	YP_001458515
Protein GI	157161197
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.687565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATG TTATTGCATC GCTTGAAAAG GTACTCCTCC CTTTTGCAGT TAAAATAGGA 
AAGCAGCCAC ACGTTAATGC AATCAAAAAT GGCTTTATTC GCTTAATGCC GTTAACCCTT 
GCGGGGGCCA TGTTTGTATT AATTAACAAC GTTTTTCTAA GCTTTGGGGA GGGGTCGTTT 
TTTTATTCCT TAGGTATTCG CCTCGACGCC TCAACCATTG AAACACTTAA TGGTCTGAAA 
GGTATTGGCG GCAACGTATA TAACGGAACA TTAGGAATAA TGTCTTTAAT GGCACCGTTC 
TTTATTGGCA TGGCGCTGGC AGAAGAGCGT AAAGTCGATG CGCTGGCGGC TGGGTTGTTA 
TCCGTTGCAG CATTTATGAC CGTCACCCCA TATAGTGTCG GTGAGGCCTA TGCGGTTGGT 
GCAAACTGGT TAGGTGGGGC GAATATCATC TCCGGGATTA TTATTGGCCT GGTGGTGGCA 
GAAATGTTTA CCTTTATTGT CCGCCGCAAT TGGGTCATTA AACTGCCCGA CAGCGTACCT 
GCTTCAGTAT CGCGTTCCTT CTCGGCATTA ATTCCCGGCT TTATTATTCT TTCCGTGATG 
GGGATTATTG CCTGGGCGTT GAATACCTGG GGCACCAACT TCCATCAGAT CATTATGGAT 
ACCATCTCAA CCCCACTGGC ATCGTTGGGT AGCGTGGTGG GCTGGGCCTA TGTGATCTTT 
GTTCCACTGC TCTGGTTCTT CGGTATTCAT GGCGCGCTGG CGCTGACCGC ACTGGACAAC 
GGCATTATGA CGCCGTGGGC ACTGGAAAAT ATCGCGACCT ATCAGCAATA TGGTTCCGTC 
GAAGCGGCGC TGGCAGCCGG TAAGACCTTC CATATCTGGG CCAAGCCGAT GCTGGACTCC 
TTTATTTTCC TTGGGGGCAG TGGTGCGACT TTAGGCCTGA TCCTGGCTAT CTTTATCGCC 
TCTCGCCGTG CTGATTATCG TCAGGTGGCA AAACTGGCGC TGCCGTCCGG CATCTTCCAG 
ATTAACGAAC CGATTCTGTT TGGTCTGCCA ATTATCATGA ACCCGGTGAT GTTTATCCCG 
TTTGTACTGG TACAACCGAT TCTGGCGGCA ATCACCCTCG CAGCGTACTA CATGGGCATT 
ATTCCTCCGG TGACCAATAT TGCACCGTGG ACCATGCCAA CCGGTCTGGG AGCCTTCTTT 
AACACCAACG GTAGCGTCGC CGCATTGCTG GTCGCACTCT TCAACCTTGG CATCGCAACG 
TTAATTTATC TGCCCTTTGT TGTGGTGGCT AACAAAGCAC AAAATGCGAT TGATAAAGAA 
GAGAGCGAAG AAGATATCGC TAACGCCCTG AAATTTTAA

Protein sequence

MSNVIASLEK VLLPFAVKIG KQPHVNAIKN GFIRLMPLTL AGAMFVLINN VFLSFGEGSF 
FYSLGIRLDA STIETLNGLK GIGGNVYNGT LGIMSLMAPF FIGMALAEER KVDALAAGLL 
SVAAFMTVTP YSVGEAYAVG ANWLGGANII SGIIIGLVVA EMFTFIVRRN WVIKLPDSVP 
ASVSRSFSAL IPGFIILSVM GIIAWALNTW GTNFHQIIMD TISTPLASLG SVVGWAYVIF 
VPLLWFFGIH GALALTALDN GIMTPWALEN IATYQQYGSV EAALAAGKTF HIWAKPMLDS 
FIFLGGSGAT LGLILAIFIA SRRADYRQVA KLALPSGIFQ INEPILFGLP IIMNPVMFIP 
FVLVQPILAA ITLAAYYMGI IPPVTNIAPW TMPTGLGAFF NTNGSVAALL VALFNLGIAT 
LIYLPFVVVA NKAQNAIDKE ESEEDIANAL KF