Gene Ccel_2859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2859
Symbol
ID	7312416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3411221
End bp	3412357
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	44%
IMG OID	643609754
Product	hypothetical protein
Protein accession	YP_002507133
Protein GI	220930224
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000759798
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATC ACGCAGTACT TTCCGCATCA GGGTCCCATA GGTGGTTGAA TTGCCTACCA 
TCTGCCAGAT TGGAACTGGA ATTTGAAAAT AGCGAATCCA ATGCAGCCGC TGAAGGCACC 
GCCGCCCATG CTCTCTGCGA ACATAAACTC AAAAAAGCAC TTCACATGAG AAGTAAGCGT 
CCTGTCTCAG TTTATAACTC CGATGAGATG GAAGAACACA GTGATGCCTA TGTGGAATTT 
GTAATGGAAC AGCTTGAGCT GGCAAAGCAG AGCTGCACAG ACCCTTTAAT ACTAATCGAA 
CAGCGTCTTG ATTTTTCCTG CTATGTTCCA CAGGGATTTG GAACCGGTGA CTGCATCATT 
ATTGCCGATA AGAAACTTCA CATTATTGAT TTCAAGTATG GCATGGGAGT ATTGGTAGAC 
GCGGTGGACA ATCCGCAGAT GAAACTGTAT GCACTGGGTG CTTTAGAAAT TTACGATAGT 
TTGTACGACA TCGAGGAAGT GTCCATGACC ATTTTCCAGC CACGCAGAGA AAATGTCAGC 
ACATGGACAA TCCCGGTAAA GGAATTAAAA GACTGGGCAG AAAATGAACT GAGACCAAAG 
GCGAAAAAGG CCTATAAAGG CGAAGGTGAC TATCTTCCAG GTGAATGGTG TACTTTCTGT 
CGAGCGGCTG TTAAATGCCG TGCAAGAGCA GAAGAAAAAC TGAAATTAGC ACAGATGGAA 
TTCAAGCTAC CCCCACTACT TACGGACTCT GAAATTGAGG AAGTTCTCTC TAAATTGTCC 
GATCTTACAA AGTGGGCAAA TGAAATCATT GCTTATGCCA CGGATGCAGC CGTTAATCAC 
GGGAAAGAGT GGCACGGTTT TAAGGTAGTA GAGGGCAGAT CGGTCCGTAA ATATAAGGAC 
GAAAAAGCTG TTGCTGAAGC AGCCAAAGCA AACGGATATA AGGACATCTA CCGTCAGAAT 
CTCATTACCC TTACAGAAAT GCAGAAGCTG ATGGGCAAAA AGAAATTTGA GCAAATTCTC 
GGTGGTCTTA TACATAAACC ACCGGGCAAG CCAACGCTGG TTCCAAATTC GGATAAGCGA 
CCAGCTATGA ATATATCAAA TGTAAAAAAC GAATTTAATG AAATTACGGA GGGATAG

Protein sequence

MSDHAVLSAS GSHRWLNCLP SARLELEFEN SESNAAAEGT AAHALCEHKL KKALHMRSKR 
PVSVYNSDEM EEHSDAYVEF VMEQLELAKQ SCTDPLILIE QRLDFSCYVP QGFGTGDCII 
IADKKLHIID FKYGMGVLVD AVDNPQMKLY ALGALEIYDS LYDIEEVSMT IFQPRRENVS 
TWTIPVKELK DWAENELRPK AKKAYKGEGD YLPGEWCTFC RAAVKCRARA EEKLKLAQME 
FKLPPLLTDS EIEEVLSKLS DLTKWANEII AYATDAAVNH GKEWHGFKVV EGRSVRKYKD 
EKAVAEAAKA NGYKDIYRQN LITLTEMQKL MGKKKFEQIL GGLIHKPPGK PTLVPNSDKR 
PAMNISNVKN EFNEITEG