Gene Ccel_1923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1923
Symbol
ID	7310641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2273419
End bp	2274504
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	37%
IMG OID	643608857
Product	peptidase M24
Protein accession	YP_002506251
Protein GI	220929342
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.412191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGAAA AAGAAATATT ATCAAATAGA TTGAATACAT TCAGAGAAGA ATTGAAAAAA 
TTGGGTCAGG ATGGTGCTTT GATTACAAAA AGAGAAAACT ATATGTATCT TTCCGGTTTC 
TCAGGTACGT CAGCAAACCT AGTAATTACT AGTAAAAAAG CATATCTTCT GACTGATTTC 
AGATATGTTG AACAATCAGC GGTACAGGCT CCTCTGTTTG AAATAGTTGA GCATAAGCCT 
GATATAAAAG ATACTATCCT AGAAATATTA GACTCCGAAG GTATTAAAAA TCTGGGATTT 
GAAGACAAAA GCCTGACTTA TTCCGAATAC AAAAGCTTTA GCTGCAAATT CCGGGATATT 
GAAATGGAAG GAATTGGCTC TGTTGTTGAA AGTCTGAGAA GTATAAAGGA TCAGTATGAA 
ATAGAAACAA TAACCAAGGC GGTTGAGATT GCAGACGGTG CATTTACACA TGTGCTTGGC 
ATTATAAAAC CTGGTATAAC GGAGTTGGAT GTTGCTGCAG AATTGGAATA TAAAATGAAG 
AAATTAGGGG CATCAGGAGC TTCCTTTGAA ACAATTGTTG CATCGGGACT GAGATCATCC 
ATGCCTCACG GAGTTGCTTC TGAAAAGAAG TTGGAGATTG GTGACACAAT AACAATGGAT 
TTTGGTGCAT TATATAACCA TTACTGCTCC GATATAACAA GAACGGTTTT TCTTGGACAG 
CCGGATAAAA AAATGGTAGA TATTTACAAT ATAGTTTTAG AGGCACAGTT ATCTTCAGTG 
AGAGGTGCTA TACAAGGCAA AACGGGAAGA GAAGTCGACA AAATAGGTAG GGATATAATT 
TATGGCAAGG GATTTGAGGG TAAATTCGGA CATGGACTCG GCCACGGTTT AGGCCTTGAG 
ATACATGAAA ATCCACGACT TTCCCCAAGC GGAGATAAAA TATTGAAAAA TAACATGGCA 
GTTACCGTAG AACCGGGTAT TTATGTTGAG GGTCTTGGAG GAGTAAGAAT TGAAGATACC 
ATAATAATCA GAGATGACAA CCCTCTTGTT TTGACTCGTT CCCAAAAGGA TTTAATTATA 
TTATAA

Protein sequence

MVEKEILSNR LNTFREELKK LGQDGALITK RENYMYLSGF SGTSANLVIT SKKAYLLTDF 
RYVEQSAVQA PLFEIVEHKP DIKDTILEIL DSEGIKNLGF EDKSLTYSEY KSFSCKFRDI 
EMEGIGSVVE SLRSIKDQYE IETITKAVEI ADGAFTHVLG IIKPGITELD VAAELEYKMK 
KLGASGASFE TIVASGLRSS MPHGVASEKK LEIGDTITMD FGALYNHYCS DITRTVFLGQ 
PDKKMVDIYN IVLEAQLSSV RGAIQGKTGR EVDKIGRDII YGKGFEGKFG HGLGHGLGLE 
IHENPRLSPS GDKILKNNMA VTVEPGIYVE GLGGVRIEDT IIIRDDNPLV LTRSQKDLII 
L