Gene Ccel_2112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2112
Symbol
ID	7310810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2471980
End bp	2473329
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	39%
IMG OID	643609046
Product	extracellular solute-binding protein family 1
Protein accession	YP_002506437
Protein GI	220929528
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0884714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAA AGGTAATAGC TTCTGTTTTA ACAGGCGTTA TGGTACTGGG AATGGCTGCT 
TGTGGAAACA CAGAGTCAGG TGACAGTACT GCTTCTGCAT CAAGCTCAGC AGCTAGCAGT 
AGTTCAGTAG CATCTACTTC TTCACCAGCT GCTACATCAA CAGACTTTAC AAAGGCTTCT 
GGAACGGTAG TAATGTGGAA CTGGGAAAAT CAGGATCAGC TTAAGACAGC AATAGCTGAT 
TTTAATACCA GATATCCAAA TGTTAAGGTT GAATCAGTAC CAGTTGCAAG TGCAGACTAT 
GTTAAGAAAA TACAGACTGC AGTTGCAGCA AAAACAGCTT TACCAGATGT AATCAGAGGA 
GAAGTTGGTT TCAGAGGAAC CCTCTTTGAC ATGGATATTT GTGAAGATCT TTCACAAGCT 
CCATACAACT TTGACAAGAC AAAGTTAGCT GAAAAGTCAT TACCTCTTGT TACAAATGAC 
AAGGGACAGG TATTAGGAGC TCCAACACAG TTCAACCCAT CAGGTATTGC ATATAGAAGA 
AGCATGACAA AGAAATTATT CAATACTGAT GATCCGAAAG AATTGGCAGA CAAGTTTAAG 
ACTTGGGAGG ATGTAATCGC TGCCTTCCAG AATGCTAAGA TAGATGGCAA GAAGGTTTAC 
GCATTCAGAT CAGTAAGAGA TATATTCCAC ATAGTTGATG GATATAATCC TCAAAACCCA 
ATTCAAGATG GAACAATCAA GTTTAACGAA GTATATCTTC CTACTTTCCA AGTTATAGAA 
AAGATGTGGA AGGCTGGCGT TATCAACAAA TATGACATGT GGACTCCTGC ATGGAATGCA 
TCATTCGCAA AGAGCGAGGA TGTATTTGCA GCAGCAGCAC CTTGGTTCCT CAAGTACGTT 
ATAGAACCAA ACGATGAAAA GGGTAAAGGT GACTGGGGAG TAACAGTAGC TCCGGGCGGA 
ATGTTCAACT GGGGTGGTAC TGCATTGTCA ATCTGGAAGG ATTCAAAGGT TAAGGATGCA 
GCGTGGGGAT ACATTGCTGA CCAGATACTT AATGAAAACG GTGTTAAGAA CTCATTTACA 
ACTGGTATGA ATATTACTCC TGTTAAAGAA TTCATTGATA AACCAGGTTT CTTCAGCCAA 
AAAGAAGAAT ACTGGGGCGG ACAGGATGTA GGACAATTCT ACATGGATAA CATGGATGCA 
GTTAAAGTTA AATCACTCGG TAAATATGAC AATTTCCTTG AAAATAATTT CGTAAAAGGA 
TTACTGGAAA TCAAAAAAGG AAAGACAGCT CAAGAAGCAG TTGATTTCAT GATTGCTGAT 
ATGAAGAAAA ATGTTCCTGA ATTGAAGTAA

Protein sequence

MFKKVIASVL TGVMVLGMAA CGNTESGDST ASASSSAASS SSVASTSSPA ATSTDFTKAS 
GTVVMWNWEN QDQLKTAIAD FNTRYPNVKV ESVPVASADY VKKIQTAVAA KTALPDVIRG 
EVGFRGTLFD MDICEDLSQA PYNFDKTKLA EKSLPLVTND KGQVLGAPTQ FNPSGIAYRR 
SMTKKLFNTD DPKELADKFK TWEDVIAAFQ NAKIDGKKVY AFRSVRDIFH IVDGYNPQNP 
IQDGTIKFNE VYLPTFQVIE KMWKAGVINK YDMWTPAWNA SFAKSEDVFA AAAPWFLKYV 
IEPNDEKGKG DWGVTVAPGG MFNWGGTALS IWKDSKVKDA AWGYIADQIL NENGVKNSFT 
TGMNITPVKE FIDKPGFFSQ KEEYWGGQDV GQFYMDNMDA VKVKSLGKYD NFLENNFVKG 
LLEIKKGKTA QEAVDFMIAD MKKNVPELK