Gene Ccel_0335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0335
Symbol
ID	7309223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	386508
End bp	388442
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	40%
IMG OID	643607264
Product	glycoside hydrolase 15-related
Protein accession	YP_002504701
Protein GI	220927792
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID	[TIGR01577] oligosaccharide amylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAT CATATTATAA CAACGCAATT ACCGGAAATT CTTCAATGCT GGCATGTTTT 
AGTGAAAGAG CTGAACTTTT AAGACTTTTT TGGCCCGATA TTGATTATAT CCAGAATTTG 
GATAAAATGT TTCTTGGACT ATTTGAGAAA AATAAAACAG GAAGCACTGT CTGGCTTAAT 
GACATCCGGT GTGAACATCA TCAGGAATAC CTTCCTGATT CTAATATAAT TAAAAACATG 
GTTACAAATT TTTTTGACGG ATACAAGGTA GTACTATATG ACTTTGTACA TCCTGAAATG 
GATGTTTTGG TACGAAGATT TGAAATAGAG AATTTACGCG GCGAGAGCAG GGAATTGGGA 
CTAATGAGTT TTTCAGCCGC CACCAGCAGT GATTCAGAGG TGGCATGCAG CTTGTTTGAT 
TTCATGAATG AAGCACTGGT TCATTATAAG CCGGACAGCT ATATTGCCGT TACATCAGAT 
ATTCCTGTAT ACCAGTTCCA AATCGGTAAT AATGCCAATG ATGCCGCTGT TAATACATAT 
CTGTATGGCA AGGACGATAT AGGAATGATG AAGGATGCGG CCATATCATG GGATCTGGGA 
GTTTTTCAGC CTCATGCTGT AAAGACTACA AATGTATATC TATGTGCGGC AGATACCCTG 
AAATCCTGTA AAGCTCTTGT AAGAAGAGTA AAAACAGTAG GAGGGCTTAC AGCCTTCAGA 
GAGACAGGGC GGTACTGGAA GGATTATCTG GAGAAAACAA CTAAATTAAA ATCAGGTAAC 
ACTCTTTTGG ATGACTTATA TAAAAGATCC CTGCTTGTAT TCAGACTGAT GTATAGTAAA 
AAAAGCGGCG GATTGATGGC TGCACCTGAA GTTGATGAAT ATTTTACAAA ATGCGGGAAA 
TATGCCTATT GCTGGGGAAG GGATGCGGCC TTTATAACAG GTGCACTGGA CATTGGAGGA 
TTGTGCGAAA GTGTTGACCA TTTTTATAAA TGGGCTGTAA ACGTTCAGGA TGAGGACGGG 
AGCTGGCAGC AGAGATATCA TATGAACGGT AATTTAGGTC CCTGCTGGGG GCTTCAGGTG 
GATGAGACAG GGACAATAAT CTGGGGAATG TTGAACCACT ATAACTATAC AAAAAATACA 
GACTTTCTGA AATCCGTGTG GGATAGTGTA AAAGCGGCCG CAGATTTCCT TGTGAGGTTT 
ATAGACAGTG AAACAGGTCT CCCAAGGCCC AGCTTTGACT TATGGGAAGA GAGATATGGA 
GAACATGCAT ATTCCTCGGC TTCCGTATGT GCAGGACTCA AGTCTGCATC AGAAATGGCA 
CGTATACTGG GAAAACCTTC CCAAGAATAT ATTCAATGGG AGACAACAGC AGACAGTATT 
AAAAAGGCAA TAGTTAAATA CTTTTGGAAA GAAGATTACA GACGTTTTAT CAGAAGCATA 
CGGGTAAAAT TAAACGGCTT CGGGCAGGAG CCTTCTTCTG ATACTATGCT GATTAAGGTA 
AATCCAAAGG GCTATGTAAG GGATGTAACA AAAGAGGATT GGATTGTAGA TGTAAGCCTT 
GTTGGATTGG GTATTCCCTT TGAAATTTTT GAGTTGAATG ATCCAATGTT GAGGGATACA 
GTTTCATTAA TTGAACAAGT CCTTACGGCA CAAGGAGTTG GCGGAATAAA AAGATATGAA 
AACGACACAT ATATAGGCGG AAATCCGTGG ATTCTTACCA CCCTTTGGAT AGCATTGTAC 
CATGCTAAAT CAGGAAACTA TAAAAAAGCA AAGGAATATC TGATATGGGC TGCAAGTGGA 
AAAACAGAAC TGGGTCTGCT GCCGGAACAG ATTAACAGGG ATACGGGAAA ACCAGAATGG 
ATAATTCCGC TTACATGGTC TCACGCAATG TACGTGCACG TTTATTCAGA GCTTATAAAT 
GCGGGTGTAC TGTAA

Protein sequence

MQKSYYNNAI TGNSSMLACF SERAELLRLF WPDIDYIQNL DKMFLGLFEK NKTGSTVWLN 
DIRCEHHQEY LPDSNIIKNM VTNFFDGYKV VLYDFVHPEM DVLVRRFEIE NLRGESRELG 
LMSFSAATSS DSEVACSLFD FMNEALVHYK PDSYIAVTSD IPVYQFQIGN NANDAAVNTY 
LYGKDDIGMM KDAAISWDLG VFQPHAVKTT NVYLCAADTL KSCKALVRRV KTVGGLTAFR 
ETGRYWKDYL EKTTKLKSGN TLLDDLYKRS LLVFRLMYSK KSGGLMAAPE VDEYFTKCGK 
YAYCWGRDAA FITGALDIGG LCESVDHFYK WAVNVQDEDG SWQQRYHMNG NLGPCWGLQV 
DETGTIIWGM LNHYNYTKNT DFLKSVWDSV KAAADFLVRF IDSETGLPRP SFDLWEERYG 
EHAYSSASVC AGLKSASEMA RILGKPSQEY IQWETTADSI KKAIVKYFWK EDYRRFIRSI 
RVKLNGFGQE PSSDTMLIKV NPKGYVRDVT KEDWIVDVSL VGLGIPFEIF ELNDPMLRDT 
VSLIEQVLTA QGVGGIKRYE NDTYIGGNPW ILTTLWIALY HAKSGNYKKA KEYLIWAASG 
KTELGLLPEQ INRDTGKPEW IIPLTWSHAM YVHVYSELIN AGVL