Gene Ccel_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1040
Symbol
ID	7309862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1295415
End bp	1296497
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	35%
IMG OID	643607967
Product	Collagenase and related protease-like protein
Protein accession	YP_002505382
Protein GI	220928473
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGAAA AAACAGGACT GTCAATCCCG TGTCAATGGG ATAAAGACAG CCTCATTGAG 
ATTCTCAACT ACGGGGTAAG TAAAGAAATT GACATTAAGG AAGTGTACGG GACAGCGTCC 
TTTGAAAATC TGCCGCATGG AAGAGCTTTT GAGGTTACCA AGCGAATCGA TAAAAATGAT 
GCACTGGAAA TTAAGAAAAT AATTTCAGAA AAAGGCATTA CATTTGCCTA TCTTATTAAT 
GCACCGCTTG AATTGGATTC ATACGAATTT TTAGAAAATG AACTGGATTG GATAGTAAAC 
GATTTTAAGG CAGATTCGAT TACAATAAGC TCTTTAAAGC TTATGAAGTT TGTTCGTGCC 
AAATATCCCG ATTTGAAAAT TAATGTATCA ACTATTGCCG GGGTTAAGAC TGTTGAAGAT 
ATGAAACAGT ATCTTCCAAT CAATCCCAGC AAGTTTATAA CGCATCATGA TATAAACAGA 
AACTATAAGG ATTTGGAAGA AATTATAGAG TTTTTAAGGG AAAAGAATAT AGACTTTGAG 
GTTATGCTCA ACGAAAGCTG TCTGAGGAGA TGTGCCAGAC GTGATGAGCA TTATAGCACG 
CTTGGGAAAG GATGCGGTGA TAGTGAATTC CATTTATGGT GTAACAGCTT AAAGGTATCG 
CATCCATATC AGCTTATCAT GTGTAATTTT ATTCGTCCGG AAGACTTAAA AGTATATGAA 
GATAAAGGGA TTAAACTATT TAAGGTAACA GGAAGGTCAA AACCATTGGG CTGGCTCCAG 
GAAGTGGTAA GAGCTTATTT AAACAGAGAA TACAATGGAA ATCTGATTCG TCTTTTAGGG 
GCTGATCCCA AACTGGAAGC GGAACGGTGG ATATATATAT CCAATAAAGC GTTAGATAAT 
TTTCTGGAAA ATTATCCTAA AAATGGAGAC GTCGGAGAGG AAATAAGATA TTGCAAAAAT 
ATAATTTTTG ACTTATACAG TAAAAATGAA TTTGCAATAA AAAATGATTT TATAAAGCCA 
GAGATAAAGG ACAGGCAATT ATCTTTCAAA ATAGAAAAAG ATATTTATGC ATGGAATTAC 
TAA

Protein sequence

MPEKTGLSIP CQWDKDSLIE ILNYGVSKEI DIKEVYGTAS FENLPHGRAF EVTKRIDKND 
ALEIKKIISE KGITFAYLIN APLELDSYEF LENELDWIVN DFKADSITIS SLKLMKFVRA 
KYPDLKINVS TIAGVKTVED MKQYLPINPS KFITHHDINR NYKDLEEIIE FLREKNIDFE 
VMLNESCLRR CARRDEHYST LGKGCGDSEF HLWCNSLKVS HPYQLIMCNF IRPEDLKVYE 
DKGIKLFKVT GRSKPLGWLQ EVVRAYLNRE YNGNLIRLLG ADPKLEAERW IYISNKALDN 
FLENYPKNGD VGEEIRYCKN IIFDLYSKNE FAIKNDFIKP EIKDRQLSFK IEKDIYAWNY