Gene Ccel_0333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0333
Symbol
ID	7309221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	383282
End bp	384544
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	38%
IMG OID	643607263
Product	glycosyl transferase family 2
Protein accession	YP_002504700
Protein GI	220927791
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATA TATTTTTTAA TATAATTTAT TATATTAGTG AATTTATTCA AATACTGATA 
TTCATAGCAG GCTGTTATTT CTTTGGAATC TCTATTTTTG GCTGGGTGAA AAGGAGACAA 
AAGTCCCCAC AAAATATTAT TCCAACAAAA CGGTTTGCCC TTGTAGTAGC TGCCCATAAT 
GAGGAGCTCG TAATTGGCCA TATAGTAGAC AGTCTTTTTA AACTGAATTA TCCTAAAAAC 
TTGTATGACG TATTTGTTAT AGCAGATAAT TGTACAGACA ATACTGCCGG AATTGCCCGA 
AGATTCGGTG CAAAGGTACA TATCCGTGAG GATGCCTCTA AAAAGGGTAA AGGACATGCA 
CTTGAATGGA TGTTTCACAG AATTTTTCAT ATGGATACGA GCTATGATGC CATTGCAGTT 
TTTGATGCGG ATAATTTGGT ATCTCAGAAT TTCCTGTTAG AAATGAATAA ACAAATGTGC 
AAGGGTTTCA AGGTAGTTCA GGGTTACATT GATAGTAAAA ACCCATATGA CAGCTGGATA 
ACCTGTTCCT ATTCAATTGC TTTCTGGCTT TCAAACAGAA TTTATCAACT CCCCAGATAC 
TATCTGAAGC TAAGCTGCGG CTTATGCGGA ACCGGGTTTT GTATAGATAC TTCCATTCTC 
AAAACTTTAA AATGGGGAGC TACCTGCCTG ACCGAAGATC TGGAATACAC CATGAAGATG 
GCCTTAAACG GAGTTAAAAT AGGATGGGCA CACGAAGCCG TAGTATATGA TGAAAAACCT 
ATTACACTCA AACAGTCATG GCACCAGCGA AAAAGATGGA TGCAGGGTCA TGCGGAATGT 
GCACAGAAAT ACCTTGGGGC TTTATTTAAG AAAGCTCTTT TTAAAGGAGA TCTTACCTCC 
CTTGATTGTG CCTTATATTT GTTTCAACCT ATAAGATTCA TTTTCGTGGG ATTAATGACT 
GTTATGATGT GGGTGCAAAC AGTTTATCCC CAATTTCCTC TTTACAGCGT ACAATACGTA 
TTTCCGGTTC AAGTATGGTA TTTAATGGGG CTCTTTGAGA TGTTTTACGG GCCGCTGGTT 
ATTCTGGCAG AGAAAAAATT CAGCTTGAAG GTGATACTTG GGTTTATTAT TTACCCCTAC 
TATTGCCTGA CTTGGATTCC AATTACCATA CAAGGCATCC TGGAGAAAAA TAACAAGGAA 
TGGAACCACA CTGTTCATAC AAGACAGATT AGTATAAATG AACTGGAGAA CAGCAATGGG 
TAA

Protein sequence

MQNIFFNIIY YISEFIQILI FIAGCYFFGI SIFGWVKRRQ KSPQNIIPTK RFALVVAAHN 
EELVIGHIVD SLFKLNYPKN LYDVFVIADN CTDNTAGIAR RFGAKVHIRE DASKKGKGHA 
LEWMFHRIFH MDTSYDAIAV FDADNLVSQN FLLEMNKQMC KGFKVVQGYI DSKNPYDSWI 
TCSYSIAFWL SNRIYQLPRY YLKLSCGLCG TGFCIDTSIL KTLKWGATCL TEDLEYTMKM 
ALNGVKIGWA HEAVVYDEKP ITLKQSWHQR KRWMQGHAEC AQKYLGALFK KALFKGDLTS 
LDCALYLFQP IRFIFVGLMT VMMWVQTVYP QFPLYSVQYV FPVQVWYLMG LFEMFYGPLV 
ILAEKKFSLK VILGFIIYPY YCLTWIPITI QGILEKNNKE WNHTVHTRQI SINELENSNG