Gene Ccel_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0052
Symbol
ID	7308971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	57092
End bp	60241
Gene Length	3150 bp
Protein Length	1049 aa
Translation table	11
GC content	40%
IMG OID	643606981
Product	SMC domain protein
Protein accession	YP_002504420
Protein GI	220927511
COG category	[L] Replication, recombination and repair
COG ID	[COG0419] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00618] exonuclease SbcC

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCGT TAAAACTTAC AATCAGTGCC TTTGGGCCGT ATGCAGGAAA ACAGTTTATT 
GATTTTACTA CCCTTACTGA GCAAATATTC GTAATATCAG GCCCTACAGG TGCAGGTAAA 
ACTACCATTT TTGACGCAAT CAGCTTTGCT CTTTTTGGAG AAGCCTCCGG AAGCAGCCGG 
GATAGGGACA GCCTTAGAAG TGATTTTGCA GAACCGGACA CGGAAACATT TGTTGAGTTG 
GAATTTGAAT TAAAAGGCAA AATATATAAA ATAAGGAGAA TGCCCCAACA GCAGCAAAGG 
AAGCTAAGGG GAGAGGGTTA TACATTAAGA AATGCCGATG CGGAGCTTTT GATGCCGAAT 
GGAACGCTTA TTACAAAAAT TGTAAATGTA GATGAAAGAA TAAATCAGCT TCTTGGTATT 
GATAAATCAC AATTCAAGCA AATTGTAATG CTTCCCCAGG GCGAGTTCAG AAAGCTGCTG 
GAATCTGACA GCAGTGATAG GGAAGTTATA TTCAGAAAGA TATTTGGAAC AGAGGATTTT 
GCCGAAATTC AGAAAAGGAT AGATGATGAC AGGGCAAGCT TAGAAAAGTC TGTTCATGAT 
TTGAAAACAC AAATAAATAC CCACATAAGT CATTTTGATG TAGGTGAAGA CCAAACATTG 
GTTGACATGA GGAATAGCAA AAATATAAAT CTGGAGCAAT TTATTTATTC TGTTGAACGG 
CTGCTGCAAA AGGATAAATC TATAATAGAT GAAATTAAGG CGGAGTTAAC TGAAACGATA 
AAAGCACAGG GAATGCTCAA GGAAGAGATT ACAAAATGCA CAGAGGTAAA CAGAAAGCTT 
TCAGACAGGG AACAAACAAA ACAACAGTAT GAGGCTCTTT TGTCAAAGGG TAACGAATAC 
AGTCAAAAGG AAAAAAACCT CGAATATGCA AGAAAAGCCC TGCCCATAAG TGAAGTTGAC 
GAGCAGTGCA GAAAAGTAAA GCAGACGTTG GAAGTAAAAG CCGGCGAATT GGAACTGGCA 
AGGCAGGAGC TTGAGAAAAG GACTTGTGAG TTTAAAAGTA TAGCGGAAAG CTTAAATACC 
TATAAAGATT TGGAGCCGGA GAACAAAAAG AATGAGACCG AGCTTGCATT ATTAGAGAAA 
ATGCTTCCAA AGGTTATCGA ATATGAGAAG GGGTTAAAAC ATTTAAATGC TGCCCGAGCA 
GAATACACTC AATTGACAGG AGAATTTGAG AGGATTCAGA GGGAGCTTGA GACAAATAAA 
ATAAAGGAAA GTCAACAGGC GGAAACTCTA AAACTGATTT ATACTACCGA GGCTGAATGT 
ATAAGCCTTG AGAAGCAAAT ATCAGAAAAC AGAAAGCTGC TTATAGAGCT TGATGGAATC 
AGAAAGTTGA TGGGGATATG TCAGGAAGAA CAAAACAGTC TTGAAAACAA GAGAGCGGAA 
TTTGCTTCCT TTGAAAAGAA CTTTTGCGAT TTCAGGAGCA GGCTTGAAGT GATGGAGGAT 
AATTATATAC GGGGGCAGGC AGGAATTCTT GCCGGAACAT TGAAAGAGAA TACTCCCTGT 
CCTGTTTGCG GAGCCTATGA CCATCCAAAG CCCGCAGAAA TGCCTTCTAG TATTCCTTCT 
CAAGAGCAGA TAAGGGATAG CAAAGCAGAG TTTTCAAAAT TAACGGAACT TAGGACGGAA 
AAGTCAAAGG CTATTTCTGA ATTAAACGGA AGTGTAGAAA GCAAATACAA AGAGATAATT 
ATCAGACTCA AAGCACTTGA TGATATTATA AAAATAGACA ATTATGCGGA ATTGGTGGGA 
AGTGGACGTT TTGAAACGGT ATTGGGGCAA ATAAACGCAA CGGGAACCGG ACTTAAGGAG 
AAAACCGTTG AATTGAAGGC TCAGTACAAT TCAAAAAAAG AGTTTACAGG CAAAAAGGAC 
GCATACGAAA AGGAACAAAC ACAAATCCGT GATAAGGTTA AAATACAGGA AGAATCTGTT 
CAGAAGATGA CTGCACAAAA AACGGGAATA TTAGAGAGTA TTACAAAATT CCAAACGGAA 
GCACAAGTTA TTGAGAAGGA GATCTCAGAA GATATACGCT CCGCATCAAA GTTAAAAGCG 
AGAATTGAGG AGCAAAAGAC AAAAATAGCT GATTTTCAGA AAGAATACAA CCAACTCAAA 
AAACTTCACG AATCCTCAAG GGAAGCTGTG AGCAATGCAG AGAAGGAAGT GGCAGTGAGA 
GTATCCTCAG TAGATGAAAG TCGAGAGGAA ATCACAAGAC AAGAAAGGCT TTTAAAGGAA 
AAGCTTGCGA GTTCTAAATT TGGGGACTAT GAGCAATTTT TGAGAATGAA AAAAACCCAG 
CAGGAAATTG ATATTCTCCA GCAAGAGATA ACTATGTATT ACCGAAGCTT AAATTCACTC 
AAGGATTTGT ATCGGCACCT GGAGGAGGAA ACAAAGGGGC TTGAAAAACA GGATATTTTG 
CTACTAAACA CCCGTTATGC AGAGCTTGAG CAAAGGCAGC AGGTGCTTCA GGAACAGCAT 
AATTTAGTGT TCTCCAGATA TAACAATAAC TCAAGAACAA TAAAGCAGCT GACTGGTACC 
ATGGAAAAAT TAAAACAGCT GGAGTGCAAA TACGGTATAA TTGCGAAGCT GGCTAAAGTT 
GCAAAAGGAG ATAATCCTCA GAGGATAACC TTTGAGAGAT ATGTGCTGGC AGCTTACTTT 
GACGAGATTA TAATTGCCGC AAACTACAGG TTAACCAGAA TGACCGGCTC AAGATACCTT 
TTAAAGCGAA AAGAGGAAAA AGGCAAGGGT AGAGCCCAGC AGGGACTGGA ATTAGAGGTT 
TTCGACAACT ATACGGGAAA GGCCCGTCAT GTAAAAACCC TTTCGGGAGG AGAGGGTTTT 
AAGGCTTCAC TCGCTTTGGC TCTTGGTCTG GCTGACGTGG TACAGTCCTA TTCCGGGGGA 
ATAAGCCTTG ATACCTTGTT TGTGGATGAG GGTTTTGGGT CCCTTGACCC GGAATCCCTT 
GACGGTGCTA TAGAATGCCT AACTGAAATC CAAAAAACAG GTCGTTTGGT AGGAGTAATA 
TCACATGTAA CTGAAATAAA AGAGAGAATA AATTCAGTAT TAGAAGTAAT CTCAAGCAAA 
GAAGGAAGCT TTATAAAATT TAATATATAG

Protein sequence

MKPLKLTISA FGPYAGKQFI DFTTLTEQIF VISGPTGAGK TTIFDAISFA LFGEASGSSR 
DRDSLRSDFA EPDTETFVEL EFELKGKIYK IRRMPQQQQR KLRGEGYTLR NADAELLMPN 
GTLITKIVNV DERINQLLGI DKSQFKQIVM LPQGEFRKLL ESDSSDREVI FRKIFGTEDF 
AEIQKRIDDD RASLEKSVHD LKTQINTHIS HFDVGEDQTL VDMRNSKNIN LEQFIYSVER 
LLQKDKSIID EIKAELTETI KAQGMLKEEI TKCTEVNRKL SDREQTKQQY EALLSKGNEY 
SQKEKNLEYA RKALPISEVD EQCRKVKQTL EVKAGELELA RQELEKRTCE FKSIAESLNT 
YKDLEPENKK NETELALLEK MLPKVIEYEK GLKHLNAARA EYTQLTGEFE RIQRELETNK 
IKESQQAETL KLIYTTEAEC ISLEKQISEN RKLLIELDGI RKLMGICQEE QNSLENKRAE 
FASFEKNFCD FRSRLEVMED NYIRGQAGIL AGTLKENTPC PVCGAYDHPK PAEMPSSIPS 
QEQIRDSKAE FSKLTELRTE KSKAISELNG SVESKYKEII IRLKALDDII KIDNYAELVG 
SGRFETVLGQ INATGTGLKE KTVELKAQYN SKKEFTGKKD AYEKEQTQIR DKVKIQEESV 
QKMTAQKTGI LESITKFQTE AQVIEKEISE DIRSASKLKA RIEEQKTKIA DFQKEYNQLK 
KLHESSREAV SNAEKEVAVR VSSVDESREE ITRQERLLKE KLASSKFGDY EQFLRMKKTQ 
QEIDILQQEI TMYYRSLNSL KDLYRHLEEE TKGLEKQDIL LLNTRYAELE QRQQVLQEQH 
NLVFSRYNNN SRTIKQLTGT MEKLKQLECK YGIIAKLAKV AKGDNPQRIT FERYVLAAYF 
DEIIIAANYR LTRMTGSRYL LKRKEEKGKG RAQQGLELEV FDNYTGKARH VKTLSGGEGF 
KASLALALGL ADVVQSYSGG ISLDTLFVDE GFGSLDPESL DGAIECLTEI QKTGRLVGVI 
SHVTEIKERI NSVLEVISSK EGSFIKFNI