Gene Ccel_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0472
Symbol
ID	7309349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	540905
End bp	542188
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	34%
IMG OID	643607402
Product	peptidase M16 domain protein
Protein accession	YP_002504834
Protein GI	220927925
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.169068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTG ATACCATTGA ATATAAAAAG TACAACGAAT TATTTTACCG ATATGAACAT 
TCCAGTGGTT TAAATTGTAT AGTAATTCCT AAGAAGGGCT ACTACAAAAA GTATGCAACA 
TTTTCTACTC AGTACGGTTC TGTAGACAAT GAATTTATCA TACCAGGAGA AAATGAACCG 
ATAAGAGTTC CTGATGGAAT TGCCCATTTT CTGGAGCACA AGCTGTTTGA ACAAAAAGAC 
GGAAGTGTTA TGGATAAGTT TGCCGCTTTA GGCTCGAAAC CAAATGCATT TACAAGCTTT 
AACCAAACAG TGTACCTTTT TTCATGTACA GACTTGTTTA GCGAAAACTT CAAGCTTCTA 
TTAAACTTTG TTCAAAATCC GTATATCACC GATGAAAGTG TTGAACGTGA AAAGAAGATA 
ATAGGACAGG AAATTAATAT GTACCGTGAC GATCCCGGTT GGAGGGTAAA CTTCAACCTA 
TTGAAAGCAA TGTATAAGCA CCATCCTGTA AGATACGATA TAGCAGGTAC TACTGACAGT 
ATAAGTGAAA TTACAAAGGA AACTTTGTAT CAGTGCTACG AGACCTTCTA CCATCCATCT 
AACATGATAA TAACAGTAGT TGGTGATGTG GATCACATTA AGGTTTTTGA ACAGGTTGAA 
AATGGCATAC AGACATCGGA TAAGGCTTCT GAAATTAAAA GAATCTTTCC TAAAGAAAGT 
GAAGGGGTTA ACAAAAGATA TTTTGAACAA AATATGCCAG TAGCAACGCC GTTATTTTAT 
ATGGGGTTTA AAGACAGCAA TTTTGATTTA GAAGGCGGCG AAATCTTGAG ATATGAGATT 
GCTGTAAAGC TTCTGCTTTC AATGATTATG GGGAAAAGTT CAAAGCTGTA TGAGAAGTTG 
TACGATAAGG GACTTATTAA TGCCAGCTTT GAAATGGATT TTTCCTTAGA AAAGAGTTAT 
GCTTATTCAA TGTTTGGAGG AGAATCTGTC AATCCTGAGG AGGTTCAGGA AATGATTACA 
AATGAGATTA AGATACTAAA AAAGCAAGGC CTTGACGAAG AGGCTTTTAA CAGACTTCTT 
AAAGCCTCTA AAGGTAGGTT TCTGAGACAG CTTAATTCCC TTGAAAATAT ATCCAGATCA 
TTTATAAATT TATATTTCAA GGGTGTTACA ATGTTTGATT ATTTAGATGT TTATGATAAA 
ATGAAATTTG ATTATATTAC AGATGTGTTT GACAGTCACT TTGACATTAA ACACATGGCA 
TTATCTGTTG TTAAGCAGAA ATAA

Protein sequence

MKFDTIEYKK YNELFYRYEH SSGLNCIVIP KKGYYKKYAT FSTQYGSVDN EFIIPGENEP 
IRVPDGIAHF LEHKLFEQKD GSVMDKFAAL GSKPNAFTSF NQTVYLFSCT DLFSENFKLL 
LNFVQNPYIT DESVEREKKI IGQEINMYRD DPGWRVNFNL LKAMYKHHPV RYDIAGTTDS 
ISEITKETLY QCYETFYHPS NMIITVVGDV DHIKVFEQVE NGIQTSDKAS EIKRIFPKES 
EGVNKRYFEQ NMPVATPLFY MGFKDSNFDL EGGEILRYEI AVKLLLSMIM GKSSKLYEKL 
YDKGLINASF EMDFSLEKSY AYSMFGGESV NPEEVQEMIT NEIKILKKQG LDEEAFNRLL 
KASKGRFLRQ LNSLENISRS FINLYFKGVT MFDYLDVYDK MKFDYITDVF DSHFDIKHMA 
LSVVKQK