Gene Ccel_1136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1136
Symbol
ID	7309946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1396496
End bp	1397791
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	38%
IMG OID	643608058
Product	extracellular solute-binding protein family 1
Protein accession	YP_002505473
Protein GI	220928564
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TATTCAAAGC CCTTATTATA CTGATGGTAG TAGTTATTTC CGGGTGCTTT 
TATGACGGAG ATAACGTGCT GGTAAAATCA AACCCGCCAA AAAAGCAATT AACTTTGTAT 
ACTATACAGG GTGATTCATC TGTAAACCAA GTGATTGCCG ATTCTGTATA CAGATTTGAA 
AAGGACAATA AAAGCTTTAA AGTTATAAAC GAGCTTATTC CCAATGACTT ATACAAGAAC 
CGACTATCAG TCTGTGTAGC AACGAATCAG ATGCCTGATG TTTTCCCTAC CTGGTCTGGA 
GGGATTTTGA AACAGTATAT AAGTATTGGT GGGGTAGTTA ATCTTGATAA ATATATGAAA 
AATGACAATT ACAGTTCACG GTTTAATGAC AAGGCGTTAA ATATGGTTAC AGATGAGAAT 
GGAATATGGG GTGTCCCTGT GGAAAATATG TCAATTGCTC TAGTATTCTA TAACAAAGAC 
ATTTTTAATG CCTTGAAGTT ATCCGAACCA AAGACTTTTG ATGAACTCAA GAATATTATA 
GTTAAGTTAA AACAAAGGAA TTATATTCCG TTTGCTCTTG CAAACAGGAC GGCTTGGACC 
GGGTCGATGT TTTATATGTA TTTTGTAGAT CGCGTGGGGG GGCCATCTGT TTTTGATAAT 
GCTGCAAACA GGAAGAATAA CGGTTCTTTT GATGACGATG TATTTGTGCA GGCTGGTAAA 
ATGGTACATG AGCTCGTAAA TATGGGTGCT TTCCCGAAGG GCTTCAACTG GATGGATGAG 
GATGCCGGGG ACTCCAGAAA CCTTTTATAT AATAATTCGG CAGGTATGCT ATTGGCTGGT 
AGTTGGTTTG TTAGTAATGT CATGTACGAG AAACCTGATT TCGCAGAAAA GATAGGTGTG 
TTTCCATTTC CTTCAATTTC AGGGGGAAAG GGTGATCCCC GTAATACTAT TGGAACACTT 
GGGGACAACT TTTACTCCGT TGCAAGTTCA TGCGGGTACC CTGACAAAGC ATTCGAACTT 
ATAAAATACT TAATTGATGA TACTGCTGAA AAGAAGCGTA TTGATGCGGG AAAAATACCG 
CCTGTAAAGG ATCCCGACGT AGAGAATCCT TTGATTAAAG AAATATTGGG TTATATAAAT 
CAGTCTCCCA ATGTTCAATT CTGGTATGAC CAATACCTTC CTCCAAAACT GTCGGAAGCC 
CATTTAATGC TTTCACGGAG TATATTTGGA GGTGAAGACC CAAAAAAAGC TGCCGAGGAG 
ATGGAAAAGA TTACCAAACA ATACTATAAT CAATGA

Protein sequence

MKKIFKALII LMVVVISGCF YDGDNVLVKS NPPKKQLTLY TIQGDSSVNQ VIADSVYRFE 
KDNKSFKVIN ELIPNDLYKN RLSVCVATNQ MPDVFPTWSG GILKQYISIG GVVNLDKYMK 
NDNYSSRFND KALNMVTDEN GIWGVPVENM SIALVFYNKD IFNALKLSEP KTFDELKNII 
VKLKQRNYIP FALANRTAWT GSMFYMYFVD RVGGPSVFDN AANRKNNGSF DDDVFVQAGK 
MVHELVNMGA FPKGFNWMDE DAGDSRNLLY NNSAGMLLAG SWFVSNVMYE KPDFAEKIGV 
FPFPSISGGK GDPRNTIGTL GDNFYSVASS CGYPDKAFEL IKYLIDDTAE KKRIDAGKIP 
PVKDPDVENP LIKEILGYIN QSPNVQFWYD QYLPPKLSEA HLMLSRSIFG GEDPKKAAEE 
MEKITKQYYN Q