Gene Ccel_3350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3350
Symbol
ID	7311917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3892033
End bp	3893418
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	36%
IMG OID	643610253
Product	extracellular solute-binding protein family 1
Protein accession	YP_002507619
Protein GI	220930710
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAGAC CCTTTTACTG TATAAAAAAC CATAATATTG ATTATATTAA ACTTGATAAA 
GGAATAAAAA GGAGAATACC GATGAAAAGA AGACTGTTAT CTTTAATAAT AGCTGTTATT 
TTGTCTGTAT GTATGCTTAC AGGATGTAAA AGGGAAGAAG CTTCACCGAA GTCTTCCGCA 
AAAAGCACTG CTTCTAAAAC TTCAAAGACC TCAAAGGTAA CCTCTGCAAA TATCAACATT 
TTTGTTAACA ACCCGGAGTA TGTTGACGCA ATAAATGAAT ATATTAAGGA ATATAAAAAG 
AACAAACCAA ACATAACTGT TAATCTGAAA ACAGTTCAAT CGGATTATTC TCAATTGCTT 
AAAATGAAAA TTAAGTCAGG AGATATGCCT GATGTCTTTA CAACTTCTGC AGGCAGTGAA 
ATCAAGGAGT ATGCTAAATA CTCCTATGAC CTTACAGGGC AACCTCTTGT AAAAGCTATG 
ACTGACGAAG TCAGAATGAA TATGTCATAT AAAGGTAAGG TTTATGGATT CCCTATCAAG 
GAAAATGTAT ATGGCTTGGT ATACAACAAG GATTTGTTTG ATAAGAACAA GATACCTGTA 
CCAAAAACAT TGGTTGAGCT TGAAGCTGCG GCTCAGAAAC TAAAATCTAA GGGTATACAG 
CCCTTTTCAA CAGGTTATAA CGAATTTTGG GTATTCAGGG ATGTTTTTAT TCATTTTTTA 
GATGCATCCC AGCCGGACGA TGTTGAAGGG CTTGTCAAGA GTCTTTCGTC AGGAAAAGCA 
AAATTTGAAA CATACCCCCT TATTAACGAT AATTTCTTTA AATTTATTGA TCTGACAGTA 
AAGTACGGTG ATATAAAACC ACTTGAAACG GATCTCTCTG CAGAACTTGC CGACTTTGCA 
ATGGGAAAGG CGGCTATGAT TATAGGACAG GGCTCATGGG CTGAGGCTGA TATTCTAAAA 
ATTAATCCCA AAATAAAGCT TGGAGTTACA GGGTACCCGG TAGACGATAA AACCTCAAAT 
GCATTTATTG TGGCGGGAAC TGAGCAGGCT ACGAGGATAT ACAAGGATTC ACCTGCATTG 
GCTGAAGTTC TGGACCTATA CAACTGGCTT TTTACTTCCG ACTACGGTAA AAAGTGGTTT 
TCAAAGGTTG CCAAGGTGAT GCCGCCCATA AACGGTGGGG ATATGTCAAA AATGCAGATT 
GCAAAAGAAT TTGAGACATC TAAAAAGGAA AATAGGGTTG GAGATATGTA TGTAAACTAT 
GTGACTGATG ATTTTCATCA GAAGTTCGGA GAAATAATGC AGGGATATAT TGCAAAAACT 
TTTACAAAGG AGCAGGCGGT TAAGGAAATT GAAAATTCGT TTAAGAAAAC AAATAAAGAA 
AAATAG

Protein sequence

MIRPFYCIKN HNIDYIKLDK GIKRRIPMKR RLLSLIIAVI LSVCMLTGCK REEASPKSSA 
KSTASKTSKT SKVTSANINI FVNNPEYVDA INEYIKEYKK NKPNITVNLK TVQSDYSQLL 
KMKIKSGDMP DVFTTSAGSE IKEYAKYSYD LTGQPLVKAM TDEVRMNMSY KGKVYGFPIK 
ENVYGLVYNK DLFDKNKIPV PKTLVELEAA AQKLKSKGIQ PFSTGYNEFW VFRDVFIHFL 
DASQPDDVEG LVKSLSSGKA KFETYPLIND NFFKFIDLTV KYGDIKPLET DLSAELADFA 
MGKAAMIIGQ GSWAEADILK INPKIKLGVT GYPVDDKTSN AFIVAGTEQA TRIYKDSPAL 
AEVLDLYNWL FTSDYGKKWF SKVAKVMPPI NGGDMSKMQI AKEFETSKKE NRVGDMYVNY 
VTDDFHQKFG EIMQGYIAKT FTKEQAVKEI ENSFKKTNKE K