Gene Ccel_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3033
Symbol
ID	7311638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3582720
End bp	3584711
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	40%
IMG OID	643609935
Product	hypothetical protein
Protein accession	YP_002507305
Protein GI	220930396
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.878032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCAGG TATCAGATTT ATTTAAAAAA TATGCAAGAA ATTATGATAG GACCCTAGAT 
GCAAAGGTTC TAATAGACGA CTTGACGCTT ACTTCAAGTG CCGTTGTTGA ATTTACTATT 
GAGGATGACA TTGCTCCATC TGGTGATTTT TCTATTGGCA CTGCCACAGC GTCGAAGCTT 
AACCTATCTT TGAGAACAGT GGAGACTATA CCCGTAAATG CAAAAATAGT TCCTTATATC 
CGGTTCCTTG GAAGTGAAGG TGAATCCGAG TGGTTTAAGT TGGGGGAATA CTTCATTGAC 
TCACGAATTA TCGAGCAGAA GGTCTGGAAG CTTACCTGCT TTGACAGGAT GATATATGGC 
GAACAAGACT TTATATCAAG CCTTATTTAT CCTGCAACAA TGCAGGCTGT TTGGGATGAG 
TGCTGCGGAA TACTTGGTGT TGAATCATCA GCAGATATAA ACCAGGCTTA CACATTCCAA 
GTAGCACCCA CAGGCCATAA AATCAGGGAG GTACTAGGTT TTATAGCTGC GGCTCATGTC 
GCTAGTGCCA AAATTATGAA AGACGGAACA ATGGGTTTAA TCAAGTTTGC TAAAAGTAGC 
CAGACAGTTG AAAAAATAAC AGCATCTAAC TACATTAAAG CCCCAGTAAC AAACCCGGCA 
AAATCAATAA CAAAGATAGT AGTAACAAGC AATAACCAAG GCGACACAAG CCAAATTGAG 
GTCGGAGAAG GTGACGAAAG CAAGACATTA ACCATTAATA ACCCATACAT AAACCAGAAC 
ATACTTAATG ATATGTATGC CACTCTAAAC GGTTTTAGGT ATGTTCCTTA CAGTATGGAG 
TGGTTTTGTT ATCCTTGGTT AGAAGTAGGA GACACAATCG ACATAGAACA GTTTCAAACT 
TTAAGTTGGC TTGAAGCTAC AATGCCATGG AAGGATGCGG ACTTTCCTTG GCGTGACCTA 
CCAACTTTTA ACACGGTGTT AATGAAAAAC ACAATCAGCT ATAAAGGTGG CCTAAAAGCT 
TCATCCTCTG CGTCGGCTGC ATCGGCCCAG CAGAGTGAGA CAAAATTCAA AGGACCATTG 
ACAAGGAAGG TAGAACATAT AGACAAGACC GCAGTAAAGG AAAACAAAAA TTATTACGGT 
GTATCGATAA CCAGGGAAGA AGGAATTCGA GTAGACAGTA CCTCTGGCAG TTCTGCTATA 
TTTAACGGCG ATACAATCAG TTTAGGGGCA TCAAGTGACA GCGGTATATA CTTTGATTAC 
CTCACAGGCA AATACAGAAT AAATGGCACT CTTGAAGCAG TGGACGGCCA TTTCGACGGA 
ACTGTTCTTG CAGAAAACAT TGACACGACA AATGCGAAAA TATCAGTTGC ACAGATTGAA 
GATTTGATTG TAGGTAATAA TGTCGAAATG GGACCAAACG CAATGATTGC GTGGAACAAA 
GTAATAGGCT CGAACGCAGG GGCAGTGTCG GCGTGGGAAG ACAGTGGATA TGCAACACAC 
ATAACTTCAT CAGGAGTATA CACGGGCAGT ATATATGCAA ATCAAATTTA CGGTGGAGTG 
GCAAACTTAA ATGATGAAGT TAATATTGGG GATCCGAATT CACTCATGCC TAAATCACTT 
AATTTTTACA ACAATGCCTC AAGTTCTTCT TGGAGCGGTT TGTCTTTGAA TATAGATGGG 
GCTTTGCTTT TAGATTCTTA TAACGGAGTA AGTATTTATG GGGGCCCATT TAATTGGATT 
GATATAGGGT TGCATGGACA AGATAACATA TACTTATTTG GTGATGTAGA AATTAATGGT 
ACGTGCAAAT TTAATGCTGT TGATTTTAGT GATTCCTATG TTGATGGATT ATATACGGAT 
AATACTGGTT TACACAACCA TGGTATAGCT GGTGGAACAA GATTAGCTAA AGTTGATGAA 
AATAATAATA TTACAGGATA TGTAACTTGG GTGGAAAGCG GTGGCCATAG TCATATAGTA 
GATGCCTATT AA

Protein sequence

MYQVSDLFKK YARNYDRTLD AKVLIDDLTL TSSAVVEFTI EDDIAPSGDF SIGTATASKL 
NLSLRTVETI PVNAKIVPYI RFLGSEGESE WFKLGEYFID SRIIEQKVWK LTCFDRMIYG 
EQDFISSLIY PATMQAVWDE CCGILGVESS ADINQAYTFQ VAPTGHKIRE VLGFIAAAHV 
ASAKIMKDGT MGLIKFAKSS QTVEKITASN YIKAPVTNPA KSITKIVVTS NNQGDTSQIE 
VGEGDESKTL TINNPYINQN ILNDMYATLN GFRYVPYSME WFCYPWLEVG DTIDIEQFQT 
LSWLEATMPW KDADFPWRDL PTFNTVLMKN TISYKGGLKA SSSASAASAQ QSETKFKGPL 
TRKVEHIDKT AVKENKNYYG VSITREEGIR VDSTSGSSAI FNGDTISLGA SSDSGIYFDY 
LTGKYRINGT LEAVDGHFDG TVLAENIDTT NAKISVAQIE DLIVGNNVEM GPNAMIAWNK 
VIGSNAGAVS AWEDSGYATH ITSSGVYTGS IYANQIYGGV ANLNDEVNIG DPNSLMPKSL 
NFYNNASSSS WSGLSLNIDG ALLLDSYNGV SIYGGPFNWI DIGLHGQDNI YLFGDVEING 
TCKFNAVDFS DSYVDGLYTD NTGLHNHGIA GGTRLAKVDE NNNITGYVTW VESGGHSHIV 
DAY