Gene Ccel_1133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1133
Symbol
ID	7309943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1393138
End bp	1394493
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	41%
IMG OID	643608055
Product	extracellular solute-binding protein family 1
Protein accession	YP_002505470
Protein GI	220928561
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TAATTGGAAA AACCCTTTCT GCCGCTTTAG CACTAGCTAT GACAGTATCA 
ATTGCGGCTT GTGGTTCAGG GAACCAATCA GAATCATCAT CCTCTTCTGC AGCAGGTAGT 
TCTTCATCAG CTGTTGCGAC AAATACTGCG GCATCAGGCG ATCCTGTAAA ATTTACTTTG 
TGGCATGTTC AGACAACCGA TCCTATGCCG ACTAATATCC AGTCAGACAT TGATCGTTTC 
ACTAAAGACA ATCCAAAGTA TTCAGTTGAT GTTCAGGTTA TGCAGAACGA TGCATACAAA 
ACAAAGCTAA AAATTGCGTT GAGTTCAAAT ACTGCACCGG ATATATTCTT TAGTTGGAGC 
GGCGGCCCAA TGAACGAATA TGTTGACGCA GACAAGATTG TAGATTTAAC ACCTTATATG 
AATAAAGATG ATTATAAGGG ACGCTTTATG GATGCATCTA TCAATCAGGC TACATACAAA 
GATAAAATCT GGGGTGTTCC AGTAGAAAAC ACAGCTGTTG CAATGTTCTT CTACAACAAG 
GACTTATTTG CTAAATACAA TCTGCAGGTT CCTAAAACAA TAATAGAACT TGAGGCTGTA 
AGTGATACAT TAAAGAAAAA CGGAATTATT CCTTTCTCAC TTGCAAACAA GACTCAATGG 
ACAGGTTCAA TGTACTATAT GTACCTTGTT GACCGTATTG GCGGAGCAGA TGCCTTCAAC 
AATGCAGCCG GACGTACCGG ATCATTTGAA GACGATGCAT TTACACAGGC AGGAAATATT 
ATACAGGATT GGGTTAAGAA GGATTACTTC AACAAGGGAT TCAATGGTCT TGATGAAGAT 
TCCGGTCAAT CCCGTACACT TCTGTACACT GAAAAAGCAG CTATGACTCT TATGGGTTCA 
TGGTTCCTTT CAACAGCAGC GGGTGAAAAT AAAGACTTCA TGAAAAAAGT TGGTTCATTC 
CCATTCCCTG CTTATGAGGG TGGTAAAGGT GATGCTAACT CAGTTGTTGG TACTGTAGGG 
GATAACTTCT ATCACATAGC AAAGACATGT AAAGACCCAG AAGGTGCATT CAAGGCTATT 
CAGTATATGA TAGACGAAAC AGCTGTTCAA AAACGTATTG AAGCAGGAAG AGTTCCTCCT 
GTAAAGGGTG TAAAGGTTAG CGATCCTCTT CTCCAGAACG TTTTAGATGC AGTTGAAAAG 
GCTCCTTCCG TTCAGTTGTG GTATGACCAA TATCTGTCAC CTGAATTGTC TGACCTCCAC 
AAGAGTACGT CACAAGCTAT CTTCGGATTG TCAAAGACAC CTGATCAGGT TAACAAGGAA 
ATGGAAGCAA AGGCTAAAGA GTTAGCAGGT AAATAA

Protein sequence

MKKVIGKTLS AALALAMTVS IAACGSGNQS ESSSSSAAGS SSSAVATNTA ASGDPVKFTL 
WHVQTTDPMP TNIQSDIDRF TKDNPKYSVD VQVMQNDAYK TKLKIALSSN TAPDIFFSWS 
GGPMNEYVDA DKIVDLTPYM NKDDYKGRFM DASINQATYK DKIWGVPVEN TAVAMFFYNK 
DLFAKYNLQV PKTIIELEAV SDTLKKNGII PFSLANKTQW TGSMYYMYLV DRIGGADAFN 
NAAGRTGSFE DDAFTQAGNI IQDWVKKDYF NKGFNGLDED SGQSRTLLYT EKAAMTLMGS 
WFLSTAAGEN KDFMKKVGSF PFPAYEGGKG DANSVVGTVG DNFYHIAKTC KDPEGAFKAI 
QYMIDETAVQ KRIEAGRVPP VKGVKVSDPL LQNVLDAVEK APSVQLWYDQ YLSPELSDLH 
KSTSQAIFGL SKTPDQVNKE MEAKAKELAG K