Gene Ccel_2447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2447
Symbol
ID	7312364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2951670
End bp	2955083
Gene Length	3414 bp
Protein Length	1137 aa
Translation table	11
GC content	36%
IMG OID	643609377
Product	peptidase M16 domain protein
Protein accession	YP_002506756
Protein GI	220929847
COG category	[R] General function prediction only
COG ID	[COG1026] Predicted Zn-dependent peptidases, insulinase-like
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TTGTTTCGTA CATGATGACA TTTGTTTTAA TTTTAAGCCT CTGTCTTAAT 
GCAGCACCGA GTGTAAATGC TGCTCAAACG GAACTCAAGG CATTGCCGGA GGCAGGTCAG 
GTAGTTTCCG GTTTCAAGGT TATGGAAATT GGAAATATGG ATATTATTGA CAGTAAAACT 
GTTTTATTTG AGCATGAAAA AACAGGTGCA AAGTTTATTT TTATACAGAA TAAGGATACT 
AACAGGACAT TTGACATTTC ATTCAAAACA CCTGCTTTTA ATGATACGGG GGTTAATCAT 
ATACTAGAGC ATATAACCGT ATCCGGCTCA CAGAAGTATC CAATGAAAAA TGTATTATTT 
ACAATTCTGA ATCAGACATA TTCTACTTTT ATAAATGCAT TTACAGCCCA AAACTTTACT 
ACATATCCTG TCTCATCACT GAGTGAGGAT CAGCTCTTGA AGCTAGCAGA GGTTTATCTG 
GACTGTGTAT ATCATCCGTC GGTATATAAT GACAAAAATA TCTTTAAAAG AGAAGCCTGG 
AGATATGAAA TGACGGACAG CAAGGCTGAT CTTAATATCA GCGGTACAGT ATATAATGAA 
ATGAAGGGTG CCTTGGGAAA TATAACAACT GCGGCGGCAT ACAATGATTT AAAAACCCTA 
TTTCCTAACA GTACTCAATC TACCATTTCG GGAGGAGATC CTGAGAAGGT AAAAGACCTG 
AAATATGAGG ACGTAATAAA GACTCATCAA ACATACTACC ATCCATCCAA TTCACTGATG 
GTTCTCTATG GAAATGTGGA TTATGAAAAG TTTCTTAAAA TGATTGATAC TGATTATCTT 
TCAAAATATG AAAAGAAAGA CATAAAGATT GAAAAACTAA AGCTGGAGCC ATTTAAGAAA 
ACAGTAGAAA AAACCTATAA ATATCCTGTT GCTGCCGGTA CAAATACTAA AAATGCATCT 
CAGATCGATT ATTGCTTTGC ACTGGAAAGT ATCTCCAACG AAGAATTACT GGGTGTAGCT 
ATTTTGAATG AGTTAATTGG AAGTAATACT TCTGCATTGA AACAGGAATT CAGGGATAAA 
AAGCTTGGAG GAGATATAGC AGTTACTTTT AATACAGGAT TATCAATACC TGTTTTGACT 
TTCTCCGCAC AAAATACTGA TGAAAGTAAA AAAGCTGATT TTAAAGCACT TGTTGATAAA 
TATCTGAGTA ATGTTGTAAA ATCTGGCTTT AAGACGGATG ACGTAGATTC AGTAATTGCC 
GGAGAATTAA GGGGATTATC GAGCATTACC GAAACGCCTA ACCTTGGAGT AAATTTGTCT 
ACACAAATGG GCAGCTTCTG GGCTAATTTA GGCAGTCCTG ATTTTTATAA CGATATGCTT 
AAAAATATAA AGTCTATGGC TGCTAAATCA GGCAAAAAAT ATTTTGAAGG CCTTACCGAG 
AGATTTCTTA TAAACAATAA AAACACAGCA CTGGTTACTA CTGTTCCTGA GGCAGGACTT 
GCTGAAAAGC AGGCAGCAGA ACAGAAAAAG TATCTTTCTG ATTTAAAGGC ATCAATGAGC 
CAACAGCAAA TAGATGCGAT TGTCAAAGAA ACAAAAACCT ACAACGAGTG GAACAGCAGA 
GAAGATAATA AAGATGTAGT TAAGAGTATT CAGGCAGTGA AGATTTCTGA TTTGCCGGAG 
GAAGTAAAAA ATTATAACGT TAAAGAAGTT AAATCTGATG GAGTAAGATT GATATCAGCG 
GAAGCTAATG TTGGTGAAAT CGAATCCACA CGTCTCTATT TGGACACTTC AGCTGTTCCT 
GCTGATAAGC TTCATTACTT GAAGCTTTAT ACTGATTTAT TGGGAAACCT TGATACCAAG 
TCCCATACAA AGGATGAATT AGGAAATCTT AAGACAAGGT ATATCAGCGG AGTCGCATTT 
AATTTATCCG CCTTGACTGA TAAAAATTAT AAAAATTATT CTCCTGTCCT AAGTGCTTCA 
TGGACTGGAA TAATGGGGGA CTATGATAAG CAGATTGAGG TTGTAAAAGA CATTCTGCTC 
AATACTCAAT TTAATAAAAA CACTGATATT TTAAATATAA TCAAGTCCAG AATATCGGAA 
CTTAAAATGC AATTTACAAA CAGTCCTATA AGTATACAAG CAATGAGAAG CAGATCCTAT 
TTTAGTGAGG TATATAACTA TCTTAATTAT AGTACAGGAT TAGATTATTA CAATTTCCTT 
ACAGAATTGG AAAAAGAAAT TTCCAATAAT CCCCAAGGTG TATTAAAAGA GCTGAATAAT 
ATCAAAACAT TGGTTACAAA TAAAAAGAAT TTGATAATAA CATTCGCAGG TAATAAAAAG 
AGTATCAGCA GGTTTGAGTC TACAATCAAG AATTTAACCG ACGGGATGTC ATCAAAGGAT 
ATTGTGAAGC AGGATTATTC AAAACTTCCA AAGCCTGTAA AAAGAGAGGG TATATCAGTA 
GACGGTACTA TACAGTATAA TATGCTTTAT TCAACATATG AAAAGATGGG GACTGTATTT 
AGCGGAAAAT ATATTCCAAT AGGTTCAGTT ATAAACGAAA ACTATATCAC TCCTAAGATA 
AGATTCGGCT ATGGTGCGTA TGATAATATT GTCAATTTTG GAGAAGAAGG CTTTATGCTT 
GCATCATTCC GTGACCCTAA TGTAAAAGAA ACCTTTGAGG TTTATAATGG ACTTCCGGAG 
TTCGTTAAAA ATGTTGATCT TACTCAGGAA CAGCTGGATA GTTACATTTT GAAGTCGTTC 
AGCGATTACA CCGTGTCTGC GGGCGAATTA TCGGGAGCCG GCACAGCACT TTCCTACTAT 
TTGATGGATT TTAAATCAGA GGATATTTTA AAGATATTGA AAGAAATTAA ATCCGTTACG 
GTGCAGGATG TTAAGGATAC GGCTTCAATG CTTGAAAATA TGCTTAAAAA CGGAGCATAT 
TCAACAGCAG GCAGTAAGGA AAAACTTACT GAAAACAAGG AGCTTTATGA TGGTATAGTT 
TCAGTAGGTC AGGAAGAGGA TTCTAAGTCA GATAGTTCAA TTACAAGAGG TGAGTTCTTT 
AAATTGGTCT TGGCTGGTGC TCCAGAGCCT CTTGAAATAG CCAAACAACA AGGCCTGATA 
ACCGCCGATA AAAAGGGAAA CTACCATGAG AACAGAAAGT TGACAAGAGA AGAGCTTGCA 
GTTTTTGTAT ACAAAATAGC AACTCTGAGC GGCGTACAGC TTCCGACTGC AAACCCTGAA 
ATCGCAGATA TTAATTCCTC AGCAACATGG TCTAGGAATG CTATCAAAGC TTTGGTGGGA 
TTTGATGTAA TCAAGCTGGA TGACAAGGGC AATTTCAATC CGAAAGGTGA AGTAACAGAT 
GCCTATGTCA CTGATCTTTT TAATAACTTA AATCAGAAAC TTTCAGGAAA ATAA

Protein sequence

MKKVVSYMMT FVLILSLCLN AAPSVNAAQT ELKALPEAGQ VVSGFKVMEI GNMDIIDSKT 
VLFEHEKTGA KFIFIQNKDT NRTFDISFKT PAFNDTGVNH ILEHITVSGS QKYPMKNVLF 
TILNQTYSTF INAFTAQNFT TYPVSSLSED QLLKLAEVYL DCVYHPSVYN DKNIFKREAW 
RYEMTDSKAD LNISGTVYNE MKGALGNITT AAAYNDLKTL FPNSTQSTIS GGDPEKVKDL 
KYEDVIKTHQ TYYHPSNSLM VLYGNVDYEK FLKMIDTDYL SKYEKKDIKI EKLKLEPFKK 
TVEKTYKYPV AAGTNTKNAS QIDYCFALES ISNEELLGVA ILNELIGSNT SALKQEFRDK 
KLGGDIAVTF NTGLSIPVLT FSAQNTDESK KADFKALVDK YLSNVVKSGF KTDDVDSVIA 
GELRGLSSIT ETPNLGVNLS TQMGSFWANL GSPDFYNDML KNIKSMAAKS GKKYFEGLTE 
RFLINNKNTA LVTTVPEAGL AEKQAAEQKK YLSDLKASMS QQQIDAIVKE TKTYNEWNSR 
EDNKDVVKSI QAVKISDLPE EVKNYNVKEV KSDGVRLISA EANVGEIEST RLYLDTSAVP 
ADKLHYLKLY TDLLGNLDTK SHTKDELGNL KTRYISGVAF NLSALTDKNY KNYSPVLSAS 
WTGIMGDYDK QIEVVKDILL NTQFNKNTDI LNIIKSRISE LKMQFTNSPI SIQAMRSRSY 
FSEVYNYLNY STGLDYYNFL TELEKEISNN PQGVLKELNN IKTLVTNKKN LIITFAGNKK 
SISRFESTIK NLTDGMSSKD IVKQDYSKLP KPVKREGISV DGTIQYNMLY STYEKMGTVF 
SGKYIPIGSV INENYITPKI RFGYGAYDNI VNFGEEGFML ASFRDPNVKE TFEVYNGLPE 
FVKNVDLTQE QLDSYILKSF SDYTVSAGEL SGAGTALSYY LMDFKSEDIL KILKEIKSVT 
VQDVKDTASM LENMLKNGAY STAGSKEKLT ENKELYDGIV SVGQEEDSKS DSSITRGEFF 
KLVLAGAPEP LEIAKQQGLI TADKKGNYHE NRKLTREELA VFVYKIATLS GVQLPTANPE 
IADINSSATW SRNAIKALVG FDVIKLDDKG NFNPKGEVTD AYVTDLFNNL NQKLSGK