Gene Ccel_2643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2643
Symbol
ID	7311286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3183812
End bp	3185200
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	50%
IMG OID	643609568
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_002506947
Protein GI	220930038
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC GTATATTTTT CGCTGTAGTG CTGGCCGCCA TGCTTTTGAC CGTATCTGCT 
TTGGCAGCCG AGGCTGAGGC GATACGGGTG GCTGTCATTG ATACGGGCAT TTCTGAAACA 
GCCATCCCCA AGACAAACTT GTCCTCTGGG CGAAATTATA TCCTACCCAA TAAAACCACG 
ACTGACACAG TTGGACACGG TACGGCAATA GCTTCTATCA TTGTAGGCAG CGAGACGGCA 
GGGATAAAGG GGATTTGCCC TGAGGCTATG CTGGTTCCAT TGGTCTATTA CGCAAAAAAC 
GAAGATGGAG GTACCATTAA GGGTGACGGT GTCATGCTGG CAAAGATAAT TCGTGACGCG 
GTGGAGGTCT TTGACTGTAA AATCCTCAAC ATAAGTTCCG GTGTTTTGAC CGACACACCA 
GCTTTGCGGG ATGCGGTAGC ATGGGCGGAG AAACAGGGAG CATTGGTAAT TTCCAGTGTG 
GGAAATGACG GGAATGACAC CGTTTACTAT CCTGGTGCAT ACAGCAGTTC TTTATGTGTA 
GGTGCGGTGA ATGACGCGAA CAGTGCTCCG GCAGACTTCT CCAACCGTAA TGAGGCAGTG 
GATCTATTGG CTCCCGGAGA AAAGTTGCCC ACAGCTACCA TGAAGGGCAA TCGCCTGCTG 
GCTAGTGGCA CTAGCTTTTC CACGGCCTAT ATTTCAGGTG TTGCAGCTAA GCTGATGAAG 
GAATATCCCG ACCTAACAGC GGCACAGATA CGGCAGATTC TCTATGCCTC TGCCACAGAT 
TTCGGCACTA CCGGCTATGA CAGAGTTTCC GGTTGGGGCA TTTTGAATCT GGAGCAGGCA 
CTTGACTACG CACGGCAGGG CTGTCTGTTT CGGGATGTGG ATTCATCAAA ATGGTACTTT 
GAAGGTGTGA GAAAAGCTGC AAAACTCGGA CTTTTTCAAG GGACGAGTGC GGTTGAATTT 
TCTCCGAATC AGCCAACGAC CCGTGCCATG CTGTGGATGA TGCTCTATCG CTTGCATGGA 
CTCAAGCCTT CTGAAAGCAC CACAATCTGG TATAGGGATG CTAGGTTGTG GGTAACAGCG 
AATGGCATTT CTGACGGAAC AAACCCTAAT TGCACGATTA CTCGGGAACA GATGGCGGTC 
ATGCTGTATG GTTATGCCTC AGTTTTCGAT TATGATATAG GTAAACGGGC GGATTTAAGT 
AAATTTACCG ATTCCGACAG CATTAGTTCC TACGCAAAGG ATGCCCTCTC CTGGGCCAAT 
GCCAGCGGAC TTATCAGCGG AACGGGTACG CAGACCCTAT CACCACAAGG CAGTGCTACC 
AGAGCTCAGG TAGCGGTGAC TGTAATAAAG TTTTATGATT TAGTATTTGG TGGAGTGAGG 
GGCACGTGA

Protein sequence

MKLRIFFAVV LAAMLLTVSA LAAEAEAIRV AVIDTGISET AIPKTNLSSG RNYILPNKTT 
TDTVGHGTAI ASIIVGSETA GIKGICPEAM LVPLVYYAKN EDGGTIKGDG VMLAKIIRDA 
VEVFDCKILN ISSGVLTDTP ALRDAVAWAE KQGALVISSV GNDGNDTVYY PGAYSSSLCV 
GAVNDANSAP ADFSNRNEAV DLLAPGEKLP TATMKGNRLL ASGTSFSTAY ISGVAAKLMK 
EYPDLTAAQI RQILYASATD FGTTGYDRVS GWGILNLEQA LDYARQGCLF RDVDSSKWYF 
EGVRKAAKLG LFQGTSAVEF SPNQPTTRAM LWMMLYRLHG LKPSESTTIW YRDARLWVTA 
NGISDGTNPN CTITREQMAV MLYGYASVFD YDIGKRADLS KFTDSDSISS YAKDALSWAN 
ASGLISGTGT QTLSPQGSAT RAQVAVTVIK FYDLVFGGVR GT