Gene Ccel_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1099
Symbol
ID	7309912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1355760
End bp	1357187
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	34%
IMG OID	643608023
Product	glycoside hydrolase family 5
Protein accession	YP_002505438
Protein GI	220928529
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA CAACAGCTTT TTTATTATGT TTTCTAATGA TTTTTACAGC ATTATTGCCA 
ATGCAAAATG CTAATGCGTA TGATGCTTCA CTTATTCCGA ATCTTCAGAT TCCACAAAAG 
AACATTCCGA ATAATGATGG AATGAATTTT GTAAAAGGTT TAAGACTCGG ATGGAATCTG 
GGTAATACAT TTGATGCTTT TAACGGTACA AATATTACTA ATGAATTGGA TTATGAAACA 
TCATGGAGCG GTATCAAAAC AACTAAGCAG ATGATAGATG CAATAAAGCA AAAAGGATTC 
AATACTGTTC GTATTCCTGT ATCCTGGCAT CCACACGTAA GTGGTTCAGA TTACAAAATC 
AGTGATGTAT GGATGAATCG TGTTCAAGAA GTAGTAAATT ATTGTATAGA TAATAAAATG 
TATGTCATTT TAAACACACA TCATGACGTT GACAAAGTAA AAGGTTATTT CCCAAGCAGT 
CAATATATGG CAAGCTCCAA GAAATATATA ACTAGTGTCT GGGCACAGAT TGCTGCTAGG 
TTTGCAAACT ATGATGAGCA TCTTATTTTT GAAGGAATGA ACGAGCCTCG TCTTGTAGGA 
CATGCAAATG AGTGGTGGCC TGAGCTGACA AATTCAGATG TAGTTGATTC TATTAATTGT 
ATTAATCAAC TTAATCAGGA TTTTGTTAAT ACAGTACGTG CAACAGGTGG AAAAAATGCA 
AGCAGATATC TTATGTGTCC AGGATATGTT GCATCTCCTG ACGGAGCAAC AAACGATTAC 
TTCAGAATGC CAAATGATAT TTCTGGTAAT AACAACAAAA TAATTGTATC TGTACATGCA 
TATTGTCCAT GGAATTTTGC AGGGTTGGCA ATGGCTGATG GAGGTACAAA TGCTTGGAAT 
ATAAATGATT CAAAAGATCA AAGTGAAGTT ACTTGGTTTA TGGATAATAT TTATAATAAG 
TATACAAGCA GGGGTATTCC TGTAATAATC GGTGAATGTG GAGCAGTAGA TAAGAACAAT 
CTGAAGACAA GAGTAGAATA TATGTCCTAT TATGTTGCAC AAGCTAAAGC ACGTGGTATA 
TTATGCATAT TGTGGGATAA CAATAATTTC TCAGGTACTG GTGAATTATT TGGTTTCTTC 
GATAGAAGAA GCTGTCAGTT CAAGTTCCCT GAAATTATAG ATGGAATGGT GAAATATGCT 
TTCGAAGCCA AGACAGATCC TGACCCAGTA ATTGTATATG GAGATTATAA CAATGATGGA 
AATGTTGATG CACTTGATTT TGCAGGCTTA AAGAAATATA TTATGGCTGC TGACCATGCT 
TATGTAAAGA ATTTGGATGT TAATCTCGAC AATGAAGTGA ATGCATTTGA CCTTGCTATT 
TTGAAAAAAT ATCTGCTTGG TATGGTAAGT AAGCTTCCAA GCAACTAA

Protein sequence

MKKTTAFLLC FLMIFTALLP MQNANAYDAS LIPNLQIPQK NIPNNDGMNF VKGLRLGWNL 
GNTFDAFNGT NITNELDYET SWSGIKTTKQ MIDAIKQKGF NTVRIPVSWH PHVSGSDYKI 
SDVWMNRVQE VVNYCIDNKM YVILNTHHDV DKVKGYFPSS QYMASSKKYI TSVWAQIAAR 
FANYDEHLIF EGMNEPRLVG HANEWWPELT NSDVVDSINC INQLNQDFVN TVRATGGKNA 
SRYLMCPGYV ASPDGATNDY FRMPNDISGN NNKIIVSVHA YCPWNFAGLA MADGGTNAWN 
INDSKDQSEV TWFMDNIYNK YTSRGIPVII GECGAVDKNN LKTRVEYMSY YVAQAKARGI 
LCILWDNNNF SGTGELFGFF DRRSCQFKFP EIIDGMVKYA FEAKTDPDPV IVYGDYNNDG 
NVDALDFAGL KKYIMAADHA YVKNLDVNLD NEVNAFDLAI LKKYLLGMVS KLPSN