Gene Ccel_1258 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1258
Symbol
ID	7310051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1559728
End bp	1560858
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	41%
IMG OID	643608179
Product	glycoside hydrolase family 8
Protein accession	YP_002505594
Protein GI	220928685
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAG GAGCTTATTT TACAAAACAG TACCCTAATT TATTTGCCGA ACTGGGTATT 
TCTGACGAAC AAATTAATAA AAAGGTTAAT GACACTTTTA ACACTATGTT CTTCGATCCC 
GAGGAGAAAA TTTATTTTGA AATAGGTAAA GACATGGGAT ATATGATGGA TACAGGTAAT 
AATGATGCAC GTACAGAGGG TATGAGCTAT GGGATGATGA TGACTCTGCA AATGGATCGG 
AAAGACATTT TTGACCGCTT GTGGTTATTT TCCAAAACAT ATATGTATCA AAACGAGGGA 
AAGTATCAGG GCTATTTTGC ATGGTCGGTA TCTACCGACG GAAAGAAAAA TGCCGAAGGG 
CCTGCACCTG ACGGAGAAGA GTATTTCGCT ATGGCTCTTT TCTTTGCAGG CAAAAGATGG 
GGTGACGGTA AGCCGCCCTT TGACTATAGT ATTCAAGCCA GGGATATTTT AAAACATTGT 
ATACACCAGT CGGAGATTGT TGAAGGTGGA GAACCTATGT GGGATAGTAC CAACCATTAT 
ATAAAATTTG TTCCTGAAAC GCCTTTCTCT GATCCGTCTT ACCATCTGCC CCATTTCTAT 
GAGCTTTTTG CGCTTCTGGC TAATGAAGAG GATAAAGACT TCTGGAAAAA AGCTGCTGAG 
GCAAGTCGTA ATTACCTGCA TATTTCATGC GACAGGGACA CTGGGATGGC ATCGGAATAT 
GCTGAATTTG ACGGTACTCC CAAAAAGCTG TTCCGTGATT TTCAGTTTTA TTCTGATTCA 
TACCGCGTTG CAATGAATAT AGGATTGGAT GCGGCGTGGT TCAGTAAGGA CGAGTCATTA 
GGGGATATCG TTGACAAGCT TCAGTCCTTC TTTAGTGAAA ATACGGTGTT AGGCGAATAT 
AAGGCCTATA CTGTTAAAGG TGAGCCTTTT GATGCTCCTG CCATGCACCC CGTTGCAATT 
ATCGCTACAA ATGCCGCCGG TTCACTTGCT GCTAAAGGGA AATACAGAGA TCAGTGGGTA 
AAGGATTTCT GGGAGCTTCC ATTAAGAAAA GGAGTTCATA GGTATTATGA TAACTGTCTG 
TACTTTTTCA GTTTACTGAT GCTGGCAGGA AAATATAAAA TTTACATCTA A

Protein sequence

MSKGAYFTKQ YPNLFAELGI SDEQINKKVN DTFNTMFFDP EEKIYFEIGK DMGYMMDTGN 
NDARTEGMSY GMMMTLQMDR KDIFDRLWLF SKTYMYQNEG KYQGYFAWSV STDGKKNAEG 
PAPDGEEYFA MALFFAGKRW GDGKPPFDYS IQARDILKHC IHQSEIVEGG EPMWDSTNHY 
IKFVPETPFS DPSYHLPHFY ELFALLANEE DKDFWKKAAE ASRNYLHISC DRDTGMASEY 
AEFDGTPKKL FRDFQFYSDS YRVAMNIGLD AAWFSKDESL GDIVDKLQSF FSENTVLGEY 
KAYTVKGEPF DAPAMHPVAI IATNAAGSLA AKGKYRDQWV KDFWELPLRK GVHRYYDNCL 
YFFSLLMLAG KYKIYI