Gene Ccel_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0032
Symbol
ID	7308953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	33613
End bp	35607
Gene Length	1995 bp
Protein Length	664 aa
Translation table	11
GC content	35%
IMG OID	643606960
Product	hypothetical protein
Protein accession	YP_002504400
Protein GI	220927491
COG category	[S] Function unknown
COG ID	[COG4717] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA AAAGGCTCCA TGTAAGGGGA TTTGGTAAGC TTCAGGATTT CAATTGTGAT 
TTTTCAGATG GTTTGAATGT AATATATGGA CATAATGAGA GCGGTAAATC AACTCTTATG 
GCGTTTATAA AGGCCATACT GTATGGAGTT AAGGGCGGAA GAACCGGTAA AAACGGTGTG 
TTGCCTGACA GCAGGAGATA TATGCCATGG AACAGCAGCC AGTACGGCGG GTACATGAAT 
ATTGAGTTGA ATGATGGCTG TTTATACAGG ATTGACAGAA ATTTTTTAAC CAATGAAGTA 
AACATTTTTG ATTCTTCTTT TAACGATATC TCTGTAAATT TTATTGACGG AAGGGATATA 
AATAGTGTTG GTGAAAAGCT GGTAGGACTT AATGAAAGCC TTTTTGAAAG AACTGTTTTC 
ATTAAGCAGA TGGGAACCAG GATTGATACT TCAACGTCAA AAGACCTTGT GGACAGAATC 
TCAAATATTC AGCAGAGTGG ATTTGAGGAT ATATCATATA TAAAGGCACA AAATGCTCTT 
AAAGAGGCAT TAAAGCGTCA GGTTGGAACA GATAGAAGTT ATACAAGGCC ACTGGATATT 
ATAAATCAAC GTTTGGCCGA ATTACAGGAG AAAAAGATTA ACCTGTTGAA TGAAGAAAAA 
AGGCTTGAGG AATTAAGGGA AAAACAGCAG GATATATCTA TGAAAATTAA TGAATTAAAG 
TTTAAGTACA GACTTCTAAA CAGGATAATT GATTATTGCA AGCTTAAGGA AAGACTACAA 
TTCCTAAATG AAAAAAATGA AGAAATATAC TTTCTTGAAG AATCTGCCCG TCAGGTGCAA 
GAAAATATTA CTAAGCTTGA GGAGGATAAA AAGTCAGTAA TACTTCATTT AAATAACAAT 
CAAGTGGCCA GGGGTAAAAA GTTAAGATCA ATAGATGTAT TCTTGATGAT ATGTATTACT 
GCAACGTTAA CAGTAGGTTT AGCAGCAGTT GTTTTTAACA TTTTGAGTCC TTTATTTACC 
TTGATACCTT TCTTACCAGC CTTAGCCTCT CTTGTTCTTA GGATAGGGAT CGTAAAGAGA 
GAAGAAGAAG AGTTTAAAAC AAACAAGACA AAAGAATTAA ATCGCCAGCT TTTAGAGTTT 
GATGAAAGAA TAACTCAAAA TAAGACTCAG TATCAAAAAC TTACAGACAG AATTGAAAAT 
ATTAATACTG TTGTTGGATC GGAGGTTCCG GCAGTTCTTG AAAGTAAAAT TGTGGGCGAT 
TACATCAATA TTATGAGGGA TAAACAAAAT GTAGAAGACC AACTTACTCA AAATGAGAAA 
GAACTCATTG ATGAGCTTTC CAAGGATTCA CATGGTAGTT TGTTGGTAAA GGCTTTCAGT 
ATAAATAAAA CTGTTATTCT CGATCTTCAA AGATTGGAGG ATGAGTATAG TGAAGTCGCA 
CGTATGGTAG AAAACGGGAA TAATATAAGT ATATCTGATA TTGATAATGA GATAAGCAGG 
TTGAGCAGTC AGAAAAAAAG TTTGGAGTCA AAAGGAGAAG CTCTCAAAAT TGCGATAATT 
ACATTGGAGG CAGCGGCAGA GCAGGTTAGG AAAAAATACG TACCTTTAAT GAACAGGGTA 
TTAAATAGTA CCTTTTCTAA TCTTACGTCT AAAAAGTACA ATGATGTAAG AACGGGAGAT 
AATCTCAAAA TTATGTTGGA TAACCCGGAA ACACAAACTC TTGTTCCTGT TTCAACATTA 
AGTGATGGTA CAATAGACCA GATATATCTT GCATTAAGGG TTGCAATATC GGAGACAGTT 
CTTCAAAATC ATGAGTGTAT GCCGTTTATA ATGGATGAGC CATTTGCACA GTATGACGAT 
GAGAGAACAT TTAACGCACT AAAATATATA GCCCATATAA GCAATAAACA ACAGGTAATC 
ATTTTTACCT GTAAAAAGAG GGAAGTTGAA CTTATTAGTA GCGAATTCCC TTGTAAAATC 
TGTTCATTGA CATAG

Protein sequence

MKIKRLHVRG FGKLQDFNCD FSDGLNVIYG HNESGKSTLM AFIKAILYGV KGGRTGKNGV 
LPDSRRYMPW NSSQYGGYMN IELNDGCLYR IDRNFLTNEV NIFDSSFNDI SVNFIDGRDI 
NSVGEKLVGL NESLFERTVF IKQMGTRIDT STSKDLVDRI SNIQQSGFED ISYIKAQNAL 
KEALKRQVGT DRSYTRPLDI INQRLAELQE KKINLLNEEK RLEELREKQQ DISMKINELK 
FKYRLLNRII DYCKLKERLQ FLNEKNEEIY FLEESARQVQ ENITKLEEDK KSVILHLNNN 
QVARGKKLRS IDVFLMICIT ATLTVGLAAV VFNILSPLFT LIPFLPALAS LVLRIGIVKR 
EEEEFKTNKT KELNRQLLEF DERITQNKTQ YQKLTDRIEN INTVVGSEVP AVLESKIVGD 
YINIMRDKQN VEDQLTQNEK ELIDELSKDS HGSLLVKAFS INKTVILDLQ RLEDEYSEVA 
RMVENGNNIS ISDIDNEISR LSSQKKSLES KGEALKIAII TLEAAAEQVR KKYVPLMNRV 
LNSTFSNLTS KKYNDVRTGD NLKIMLDNPE TQTLVPVSTL SDGTIDQIYL ALRVAISETV 
LQNHECMPFI MDEPFAQYDD ERTFNALKYI AHISNKQQVI IFTCKKREVE LISSEFPCKI 
CSLT