Gene Ccel_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1351
Symbol
ID	7310131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1649676
End bp	1650869
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	39%
IMG OID	643608271
Product	hypothetical protein
Protein accession	YP_002505685
Protein GI	220928776
COG category	[R] General function prediction only
COG ID	[COG5401] Spore germination protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.033419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TTATTAGTAT TGTGTTGGTA ATTATGCTTT TATCGACAGG ATGCTCTTTT 
ATTGGTCACA AAAATGAACA AGAGCCTAGC ATTCAGGCAG CAAATCAAAC AGTTAATGCT 
TCCGCATCAA ACACCGCTCA GGATTCCAAA GCAGCGGCTT CCGCCACATC AACCAATTCA 
AATGGGTTAG CTATGACTTC CGGGACAACA GCAGCTCCTA CTACAACAAG CTCAATGGTA 
AGCGGCAATT ATACCGACAG TCAGATAAAA GACCTTGTCA TAGACAACGG AGCGGGGAAA 
GGTATGGCAG CTGCTTCTGA TAAAAGCAAT CTTCTCATAA CTTTATATTA CAAAAACCAA 
AAGGGATTGA TTATTCCTGT TACCAGAACA GTTAAAAAAC AGGAAAGCCT TGCAAAGGCA 
GCAATTCTCG GGTTGGTTGA TGAAGCTGTA ACAAAAGAAC AACTGGACTA CTACGGACTT 
TACCCTGTAC TGCCCAGAGG TACAAAGATA AAAGGAATAA ATATAAAAGA TAAGGTTGCT 
GTAATTGACT TTTCCAAGGA ATTTTTAAAT TTATCGGGTA AACAGGAAGA GCAGGAGGCA 
GTAGCTTCGA TTGTGTATAC TCTGACAGGA TTCTCAACAG TATCTGATGT AAGAATCAGG 
GTTGAAGGAA AAGAAATAAC CACTCTTGAA AATGGAACGG ATTTATCGAT TCCCAGAAAC 
AGAAGCAATA CACTTATCAA TACAAGCGAC ACCCAAATAA AGGATGGATG TGTGAAATGC 
GATTTGTATT ATGTTTCAGA TGACAGCAAT AACCATAATT ATCTTGTTCC AGTGTCTATA 
CAGATACCCC AGACAGACCC TCGCGGTATA CCCGGACTAA TATTTGATGA GCTTGGTAAA 
AAGCCCAACG AAACAACTTA TTTTACATCT ATGCCAGAAG GAACAAAATT GCTTTCTTTT 
AATCGACAGG GAAGTACTGC TGTTCTGGAC TTTTCAAACC AGATTACCAA CTATGGCGGC 
TCTGAAAAAG AAGATACCTT GTTAAATCAA ATATATTATA CAGTCAGCCA GATGAAAGGA 
ATACAAAAAA TTAAGCTGCT TATAAACGGT AAGGAAAAGA CTCTGCCTGA AGGTACGGAA 
GTGGCATCAG CTAGAAGTGT TCCAATAACC TTTAATAAGG TAATAGAGAA CTAA

Protein sequence

MKKIISIVLV IMLLSTGCSF IGHKNEQEPS IQAANQTVNA SASNTAQDSK AAASATSTNS 
NGLAMTSGTT AAPTTTSSMV SGNYTDSQIK DLVIDNGAGK GMAAASDKSN LLITLYYKNQ 
KGLIIPVTRT VKKQESLAKA AILGLVDEAV TKEQLDYYGL YPVLPRGTKI KGINIKDKVA 
VIDFSKEFLN LSGKQEEQEA VASIVYTLTG FSTVSDVRIR VEGKEITTLE NGTDLSIPRN 
RSNTLINTSD TQIKDGCVKC DLYYVSDDSN NHNYLVPVSI QIPQTDPRGI PGLIFDELGK 
KPNETTYFTS MPEGTKLLSF NRQGSTAVLD FSNQITNYGG SEKEDTLLNQ IYYTVSQMKG 
IQKIKLLING KEKTLPEGTE VASARSVPIT FNKVIEN