Gene Ccel_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1988
Symbol
ID	7310699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2354358
End bp	2355695
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	38%
IMG OID	643608923
Product	glycosyl transferase family 2
Protein accession	YP_002506316
Protein GI	220929407
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGA CAACGACAAC TAAGTTAAAG ACTAAGAAAA AAATCTATAT CCCTGTAAAA 
AATAAGTTTA TTATAAGCAT GATTGCGGGA ATAGCTTGGA TGGCGACATC TATATATTTT 
TCCGTACCGT GGATAAAGGA TTTGTCACTT TACGTAACTA TGCCAATTGC AATTTTGATT 
ATTGCCGGTA TAGCATATAT CCCCGGATAT ATGAACGCAT TCATGGTATC AAGCCTTTTA 
TTGGACAGAC AGCCAAAAGT AAAAAATACT AGTCCCAAAG TCCCGGTAAC CATACTGATT 
GCATGTTATA ATGAGGAAAA AAGTATTGAG AATACCGTTA ATTATGTGGC AACACAGGAT 
TATGAGGGAG AAATAAGGCT AATAGTTATA GATAATAATT CAAAGGATAA AACAGCTGAG 
ACAGCAAAAA AAGCCGGGGA AAAAATGAAC CTCAATCTGA CTGTAGTACA CGAAAGTAAA 
GCCGGAAAGA ATTTCGCTTT AAATACTGCA TTAGCACACG TCGAAACGGA ATATGTTCTG 
ACACTGGATG CAGATACCTT ACTGCATAAA TCAGCTTTAA GGCATATTGT TGCACGTTTG 
GAAAGTTCAC CAGATGATGT ATGTGCGGTG GCAGGAACTG TTCTGGTCAG GAACAGCAGA 
GGAAATATAC TTGCAAGGAT TCAGGAATGG GACTATTTTT TAGGAATTGC CAGTATAAAA 
AGATTGCAGG GATTGTTTCA AAGCACTTTG GTAGCACAGG GGGCTTTTTC ACTGTATAAA 
ACTGAATTAA TAAGGAAGGT TGGGGGATGG CCCGATGCAA TTGGCGAGGA TATTGTTCTG 
ACATGGAGTT TTTTAAGTAA TAATTGCAGA GTTTATTTTG AGCCCATGGC AGTAGCATTT 
ACAGATGTCC CAACTTCCTT AAAGCATTTC TTTAGACAAC GAAGCAGGTG GGCAAGAGGA 
ATGGTTGAAG CTTTGAAGCT ATTCAAGCCA TGGTCGCAGC CAATTTATTC TGCAAGATAT 
CTTACCGGAT GTAATCTTTT TATGCCGTTT ATGGATTTTG TTTACACGTT TTGCTGGCTT 
CCCGGGTTGG TATTGGCTTT TTTTGGACAC TTTTGGATTG TGGGACCGGC AACACTCTTT 
GTAATACCAC TTGCATTACT TCAGAATTTC GTACTGTATA CCTATCAAAA AGGTGTTTTC 
AAATCATTAA ACCTTCGGGT CAGGAAAAAT ATTATAGGAT TTATTTTATA TGTTTTATGT 
TACCAGTTAT TAATGAGTCC TATTTCTGTT TGGGGATATA TTCAGGAAAC ACTCAAGCTT 
CGAAGAATTT GGAAATAA

Protein sequence

MKQTTTTKLK TKKKIYIPVK NKFIISMIAG IAWMATSIYF SVPWIKDLSL YVTMPIAILI 
IAGIAYIPGY MNAFMVSSLL LDRQPKVKNT SPKVPVTILI ACYNEEKSIE NTVNYVATQD 
YEGEIRLIVI DNNSKDKTAE TAKKAGEKMN LNLTVVHESK AGKNFALNTA LAHVETEYVL 
TLDADTLLHK SALRHIVARL ESSPDDVCAV AGTVLVRNSR GNILARIQEW DYFLGIASIK 
RLQGLFQSTL VAQGAFSLYK TELIRKVGGW PDAIGEDIVL TWSFLSNNCR VYFEPMAVAF 
TDVPTSLKHF FRQRSRWARG MVEALKLFKP WSQPIYSARY LTGCNLFMPF MDFVYTFCWL 
PGLVLAFFGH FWIVGPATLF VIPLALLQNF VLYTYQKGVF KSLNLRVRKN IIGFILYVLC 
YQLLMSPISV WGYIQETLKL RRIWK