Gene SeSA_A1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1410
Symbol	chbC
ID	6519538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1358882
End bp	1360240
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	51%
IMG OID	642746528
Product	PTS system N,N'-diacetylchitobiose-specific transporter subunit IIC
Protein accession	YP_002114333
Protein GI	194736376
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.470901
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0748148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG TCATTGCTTC ACTTGAAAAG GTACTCCTTC CTTTTGCTGT AAAAATAGGA 
AAGCAGCCAC ACGTTAATGC AATCAAGAAC GGCTTTATTC GTTTAATGCC ATTAACCCTT 
GCGGGGGCGA TGTTTGTATT AATTAATAAC GTTTTCCTGA GCTTTGGGGA GGGGTCGTTT 
TTTTATTCCA TGGGCATTCG GCTTGATGCC TCAACCATTG AAACACTTAA TGGATTGAAA 
GGCATCGGCG GGAACGTCTA TAACGGCACA TTGGGCATTA TGTCGCTCAT GGCGCCATTT 
TTTATCGGCA TGGCGTTGGC GGAAGAGCGC AAGGTTGATG CGCTGGCCGC CGGACTGCTC 
TCCGTGGCGG CATTTATGAC CGTAACGCCG TATAGTGTCG GCGAGGCCTA TGCCGTAGGC 
GCAAACTGGC TGGGCGGCGC GAATATTATC TCCGGTATTA TTATTGGCCT GGTGGTCGCG 
GAGATGTTTA CATTTATTGT CCGGCGCAAC TGGGTGATTA AACTACCGGA CAGCGTACCG 
GCTTCGGTGT CTCGTTCATT CTCAGCATTA ATTCCCGGCT TTATTATTCT CTCTATTATG 
GGGATTATTG CCTGGGCGCT GTCTAATTAC GGTTCTAACT TCCATCAGAT TATTATGGAC 
ACTATCTCTA CGCCGCTGGC ATCGCTGGGT AGCGTGGTAG GGTGGGCATA TGTCATTTTT 
GTACCGCTGC TGTGGTTCTT TGGTATTCAT GGTTCGCTGG CGCTGACCGC GCTGGACAGC 
GGCATCATGA CGCCCTGGGC GCTGGAAAAC ATCTCTATTT ACCAGCAGTA TGGCTCCGTC 
GATGCGGCGC TGGAAGCCGG TAAAACGTTC CATATCTGGG CGAAACCGAT GCTGGATTCT 
TATATCTTCC TCGGTGGTAG CGGCGCAACG CTGGGTCTGA TCATCGCTAT CTTCCTCGCA 
TCTCGTCGCG CGGACTATCG CCAGGTGGCA AAACTGGCGC TGCCGTCAGG TATCTTCCAG 
ATTAACGAAC CCATCCTGTT TGGTCTGCCG ATTATTATGA ACCCGGTGAT GTTTATCCCC 
TTTATTCTGG TACAACCGAT TCTGGCGGCG ATTACGCTGG TGGCTTACTA TTTGGGTATT 
ATTCCGCCGA TTACCAATAT TGCGCCGTGG ACCATGCCAA CCGGGTTGGG GGCGTTCTTT 
AACACCAACG GCAGTGTCGC CGCGTTGCTG GTTGCGCTAT TTAACCTGGC GGTCGCTACC 
CTGATTTATC TCCCCTTCGT GGTGGTGGCT AACAAAGCGC AGAACGCCAT CGAGCAGGAA 
GAAAGCGAAG AAGATATCGC TAACGCACTG AAATTCTAA

Protein sequence

MSNVIASLEK VLLPFAVKIG KQPHVNAIKN GFIRLMPLTL AGAMFVLINN VFLSFGEGSF 
FYSMGIRLDA STIETLNGLK GIGGNVYNGT LGIMSLMAPF FIGMALAEER KVDALAAGLL 
SVAAFMTVTP YSVGEAYAVG ANWLGGANII SGIIIGLVVA EMFTFIVRRN WVIKLPDSVP 
ASVSRSFSAL IPGFIILSIM GIIAWALSNY GSNFHQIIMD TISTPLASLG SVVGWAYVIF 
VPLLWFFGIH GSLALTALDS GIMTPWALEN ISIYQQYGSV DAALEAGKTF HIWAKPMLDS 
YIFLGGSGAT LGLIIAIFLA SRRADYRQVA KLALPSGIFQ INEPILFGLP IIMNPVMFIP 
FILVQPILAA ITLVAYYLGI IPPITNIAPW TMPTGLGAFF NTNGSVAALL VALFNLAVAT 
LIYLPFVVVA NKAQNAIEQE ESEEDIANAL KF