Gene Ccel_3438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3438
Symbol
ID	7312494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	4002835
End bp	4004394
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	41%
IMG OID	643610347
Product	glycoside hydrolase family 43
Protein accession	YP_002507706
Protein GI	220930797
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.990127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAA CAAATTCCAA TTATTTCAGT AATCCAATAT TGCCCGGGTT TTATCCTGAT 
CCATCCATAT GTCGTGTAGA GGATGATTAC TATCTTGTTA CATCCAGCTT TACATATTTT 
CCGGGCTTGC CTATATTCCA TAGCAAAGAT TTGGTTAACT GGAGGCAGAT AGGACACGCC 
CTTGACAGAC CTTCCCAGCT TGACCTAGAT GGTTTAGAAC AGTCTCAGGG ATTATATGCC 
CCAACCATTA GATACAATAA TGGCATCTTC TATATTGCAT GTACCAACGT TGGGAAAAAA 
GGTAATTTCA TAATAACATC GGAAAAACCT GAAGGACCGT GGTCAGACCC ATATTGGATT 
GCTGATGCAC CTGGTATAGA CCCGTCACTT TTCTTCGATG ATGATGGAAA GGTGTATTTT 
ACTGGTACAA ATGATTCTCC TGATGGAACC TATTACGGTG ATAACGAAAT CTGGATGAGG 
GAACTTGACA CCGGGAAGAT GCAGCTTACC GGTCCAAGAT ATGGCTTGTG GAGAGGTGCA 
TTGAAGAATG CAATTTGGTC GGAAGCACCC CATATATATA AAATTAATGG ATACTACTAT 
CTAATGATTG CCGAGGGCGG TACTGACTAT CACCATTCTG TCACTATAGC CAGAAGCAGG 
GAGATAACAG GACCATATGA AGGCTATATA GGGAATCCTA TCATAACTCA TAGGCATTTA 
GGAAGAAAAT ACCCTATTGC AAATGTAGGC CACGCTGATT TGGTTGAGAC CCAAAACGGT 
GAGTGGTGGA TGGTAGCACT GGCATCAAGG CCGTATGGCG GGCATTATAG AAACCTTGGC 
CGTGAAACAT TTCTTATCCC TGTAGAATGG GAAGATGGTT GGCCGGTAGT AAGCCCATTA 
AGCGGAAAAG TAGAGTTTTC ATACCAAAGA CCTGCACTAT CCCCGGATAA TCCTGTTGAA 
GTAACGGCTT GTGACCACTT TGACAATGAA AAGCTTAGTT TTATATGGAA TTTTATACGT 
ACTCCCAGAG AAAACTTTTA CAGCTTGACT GACAGGCCGG GGCACTTGAG GCTTAACCTG 
AAATCTCCTA AAATTAAAGA GCAGAAAAAT CCGAGTTTTA TTGGGAGACG TCAGCAGCAC 
ATTAATTTCC GGGCAAAAAC GGTAATGGAA TTTGTACCTG GCAACGAAAA TGAAGCTGCA 
GGTATATTAT TAATACAGAG TAACAATTAT CATATGAGGT TTGAATGTAC CAAATCAGGA 
GAGAAGGATG TAGTAAGGTT GATTGTATGT AATGACGGTA AGGAAAGTAT TGTTGCCCAA 
AGGGAAAATA CTTATACCCG GATTCACATG GTAGTTCAAG CCTACGGTCA GGATTACAGC 
TTTTATTGCG GAGATGAAAA TGAATTGGTT GAACTGGCTG TCAATGTAGA CGGAAGAATT 
CTCAGTACCG ATGTAGCAGG AGGATTTGTC GGGACGTATG TAGGGATGTT TACCAGCAGC 
AATGGTTTTG ACAGCAGTAA TATGGCAGAT TTTGATTTAT TTGAATATAC AGGCTTATAA

Protein sequence

MTKTNSNYFS NPILPGFYPD PSICRVEDDY YLVTSSFTYF PGLPIFHSKD LVNWRQIGHA 
LDRPSQLDLD GLEQSQGLYA PTIRYNNGIF YIACTNVGKK GNFIITSEKP EGPWSDPYWI 
ADAPGIDPSL FFDDDGKVYF TGTNDSPDGT YYGDNEIWMR ELDTGKMQLT GPRYGLWRGA 
LKNAIWSEAP HIYKINGYYY LMIAEGGTDY HHSVTIARSR EITGPYEGYI GNPIITHRHL 
GRKYPIANVG HADLVETQNG EWWMVALASR PYGGHYRNLG RETFLIPVEW EDGWPVVSPL 
SGKVEFSYQR PALSPDNPVE VTACDHFDNE KLSFIWNFIR TPRENFYSLT DRPGHLRLNL 
KSPKIKEQKN PSFIGRRQQH INFRAKTVME FVPGNENEAA GILLIQSNNY HMRFECTKSG 
EKDVVRLIVC NDGKESIVAQ RENTYTRIHM VVQAYGQDYS FYCGDENELV ELAVNVDGRI 
LSTDVAGGFV GTYVGMFTSS NGFDSSNMAD FDLFEYTGL