Gene Ccel_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1938
Symbol
ID	7310653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2287740
End bp	2288873
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	38%
IMG OID	643608872
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_002506266
Protein GI	220929357
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TTAATTTGGT AAGATGTGCA TTTCTAGTTA TTGTTTCTGT TTTATGTACT 
GCAAATACCT TTGCCGCCGG AACTACCCTT AGGATAAATG GGCAGGAACT CATCGACGGG 
GTAAAAACAA TAGAGGGCAG GCAGTATATA TCTGCCGATG CAATATCCTC TCATTTGGAA 
GGGATTACGG TTACTCAGGG AAACAATACC ATTGAAATAA ATTCTGTGAA CAAAATTTCA 
AATGTAGTCT CAAAAGTAAG CCCTTCTGTT GTTGGAATTA TTGGTAAATT AAAAGAGAGC 
AGTTATGAAT ATGATGAAAC TTCAGATAAT ATCATATTCG GTACAGGAGT TATATATCGC 
AGTAGTGGTT ACATAATAAC AAATGCCCAT GTTGTAAAGG ATATGGAGAG TATTGTTGTA 
GTACTTTCAA ACAGTAAAGC ATACAAGGCC AGACTTAAGG CTATTGATGA AGATCTCGAT 
CTGGCAGAGA TAAAAATAGA TAAGGGCGGC TTGCAGCCTG CAAAATTTGG TGATATTTCG 
CAAGTGGCAG TAGGGGATGA AGTCGTTGCA ATAGGAACAC CATTGTCCTT CGGACTTAGA 
AATTCCGCGA CAAGGGGAAT AATAAGCGGA ATGAACAGGT CAGAGAACAG ACAGTATAGG 
TTTATACAGA CAGATGCTGC TATCAATTCT GGAAACAGCG GCGGCCCACT GGTCAATATG 
AAAGGTGAGG TTGTAGGGAT AAATTCATGG GTTTATGCTG GAATAGGCGT GCAGGGTATG 
AGCTTTTCAA TACCTATAGA CTCTGTAAGA TACGCAATAA ACCAGTTTGA AAAGTTTGGA 
AAGATAAGAC GACCCTACCT AGGTTTGGCT TTTTCCGATA GTATAACCTC AATATACGGA 
CTACCGAATA CGGTGTCAGG GGTGACTGTA AAATCAATAG AAAAAGGTTC TCCTGCACAG 
AAATACAATA TTAAAGTTGA TGATAGACTG ATTTCCATTA ATGGAATTAA GGTAAATTCG 
ACAACAGATT ACAATGAAGA AATGAAGAAG TATCTGCCTG GAGACATTGC TGAATTCAAA 
TTACAGCGTG ACAACAGGGA ATTCAGTATT TCAGTTACTT TTGGAGAAAA ATAA

Protein sequence

MKKFNLVRCA FLVIVSVLCT ANTFAAGTTL RINGQELIDG VKTIEGRQYI SADAISSHLE 
GITVTQGNNT IEINSVNKIS NVVSKVSPSV VGIIGKLKES SYEYDETSDN IIFGTGVIYR 
SSGYIITNAH VVKDMESIVV VLSNSKAYKA RLKAIDEDLD LAEIKIDKGG LQPAKFGDIS 
QVAVGDEVVA IGTPLSFGLR NSATRGIISG MNRSENRQYR FIQTDAAINS GNSGGPLVNM 
KGEVVGINSW VYAGIGVQGM SFSIPIDSVR YAINQFEKFG KIRRPYLGLA FSDSITSIYG 
LPNTVSGVTV KSIEKGSPAQ KYNIKVDDRL ISINGIKVNS TTDYNEEMKK YLPGDIAEFK 
LQRDNREFSI SVTFGEK