Gene Ccel_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2056
Symbol
ID	7310759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2413347
End bp	2415467
Gene Length	2121 bp
Protein Length	706 aa
Translation table	11
GC content	39%
IMG OID	643608990
Product	DNA topoisomerase I
Protein accession	YP_002506382
Protein GI	220929473
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA [COG0551] Zn-finger domain associated with topoisomerase type I
TIGRFAM ID	[TIGR01051] DNA topoisomerase I, bacterial [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGATA ACCTGGTTAT TGTGGAGTCT CCTGGAAAAG TTAAATCTAT AAGCAAATTT 
TTAGGTAAGG GATATAAAGT AGAGGCTTCT GTCGGACATG TTAGGGATTT GCCTAAAAGC 
CAGATGGGCG TTGATATCGA TAATGATTTT GAACCTAAGT ATATTACTAT AAGAGGTAAG 
GGAGATGTTA TATCAAAGCT GAAAAAAGAA GCCAAGGCAG CTAAAAAAGT GTTTCTCGCA 
ACTGACCCTG ACCGTGAAGG TGAGGCGATA TCCTGGCACT TGGCCAAAAT ATTAAATATT 
GATGAAAAGC AGAAATGCAG GGTTTCTTTT AATGAAATAA CACAAAATGC TGTAAAGAAT 
GCTATAAAAC AGCCGAGAAC AATAGATATG GGCCTTGTTG ATGCACAACA GGCAAGAAGA 
GTACTGGACA GAATAGTGGG CTATAAGATA AGCCCTCTGC TTTGGAAGAA AGTAAGAAAA 
GGCTTGAGTG CGGGAAGAGT ACAATCTGTA GCTACAAAAA TGATTTGTGA CAGGGAAGAT 
GAAATTGAAA AATTTGAGTC ACAAGAATAT TGGTCTATAA TTGCAAAGCT TGTCAAACCA 
AAAGCAAGTC CTAACTTTGG GGCGAAATTC TACGGTATTG GTAAGGAAAA ATTAGAATTA 
ACTAATGAGG AACAGGTTAA TTCGATTTTA GAAGAAATAA ATAAAAGCCA ATATATCGTA 
CAAAAGGTTA AAGAGCAGGA AAAGAAAAGG GCTGCAGCGG CACCTTTTAT TACAAGTACA 
CTACAGCAGG AAGCTTCCAG AAAACTTGGA TATACAACAA AAAGAACCAT GATGGTTGCA 
CAGCAGCTTT ATGAAGGCAT TGAAATAAAG GGCCGTGGAT CGGTTGGTCT TATAACCTAT 
ATGAGAACGG ACTCAACAAG AATATCAACA GATGCACAGA ATGAGGCCAG AGAGTATATT 
AAAACAAAAT ACGGACAGGA TTATATTCCT GAAAAACCAA GAGAATATAA AAACAAATCT 
GCTTCACAGG ATGCACATGA AGCAATACGC CCAACATATA TAGATTTACC ACATGAGCAA 
ATAAAGGAAT ACCTCAGTCC GGAACAATAC AAGCTATACA GGCTTATTTG GGACAGATTT 
ATTTCCAGTC AGATGTCATC CGCTATATAC GATACTGTGT CAGCTGATAT AACTGCGGGA 
AAATACCTGT TCAAGGCAAA CGGTTCGAAA GTAAAATTTC CGGGTTTTAT GGTACTGTAT 
ACTGAAGGAA ATGATAATGA AGGCAAGGAT GAAGCGGAGC AGGACGAAAA GGAAAACAAA 
CTACCTCAGC TGAATGAAGG TGATATTCTT GAACTCAAAG AAAATACACC TAAGCAGCAT 
TTTACGCAAC CTCCTGCCAG ATACACCGAG GCAACGCTTG TAAGAGCCTT GGAGGAAAAG 
GGTATAGGAA GACCTAGTAC CTACGCTCCT ACGATTACTA CTATTTTATC CAGGGGCTAC 
GTACTAAAGG AGAAGAAGCT TTTAGTACCG ACAGAGCTCG GAAAAATAGT AAACGACATA 
ATGAAGAATC ATTTTGAGAA CATTGTTGAT ACTAAGTTTA CAGCTGAAAT GGAAAGCGAA 
CTGGATTCCG TAGAGGATGG TGACAAAGAA TGGAAGGCCG TTATGAGGGA TTTTTATTCT 
TCATTTGCCG GAGTACTTAA AAAAGCCGAA GAATCCATAG GTGATGTAGA ATTACCTGTA 
GAGGTATCAG ATGTTCAATG TGATAAATGC GGCAGATACA TGGTTGTTAA ACATGGGAGA 
TTTGGTAAAT TCCTTGCCTG CCCGGGATTT CCCGAGTGTA GAAATGCAAA GCCGATTGTA 
GAAGAGGCTG GAGTTGAATG TCCTATTTGT AAGGGAAAGG TACTTATTAA AAAGACTAAA 
AAGGGTAGAA AGTATATTGG TTGTGAGAAA AACCCTGAAT GTCCCTTTAT GAGTTGGGAT 
ATGCCTAGCC CCAATAAGGA AGTCTGTTCT GTTTGCGGAT CATTTATGCT TCAAAAATTC 
TCCGGCAAAA AGAAGGTTCT TAAGTGCAGC AACGATAAGT GTACAAGTAA TATAGAAGCC 
TCAAAAGATA ATACCAAATA A

Protein sequence

MADNLVIVES PGKVKSISKF LGKGYKVEAS VGHVRDLPKS QMGVDIDNDF EPKYITIRGK 
GDVISKLKKE AKAAKKVFLA TDPDREGEAI SWHLAKILNI DEKQKCRVSF NEITQNAVKN 
AIKQPRTIDM GLVDAQQARR VLDRIVGYKI SPLLWKKVRK GLSAGRVQSV ATKMICDRED 
EIEKFESQEY WSIIAKLVKP KASPNFGAKF YGIGKEKLEL TNEEQVNSIL EEINKSQYIV 
QKVKEQEKKR AAAAPFITST LQQEASRKLG YTTKRTMMVA QQLYEGIEIK GRGSVGLITY 
MRTDSTRIST DAQNEAREYI KTKYGQDYIP EKPREYKNKS ASQDAHEAIR PTYIDLPHEQ 
IKEYLSPEQY KLYRLIWDRF ISSQMSSAIY DTVSADITAG KYLFKANGSK VKFPGFMVLY 
TEGNDNEGKD EAEQDEKENK LPQLNEGDIL ELKENTPKQH FTQPPARYTE ATLVRALEEK 
GIGRPSTYAP TITTILSRGY VLKEKKLLVP TELGKIVNDI MKNHFENIVD TKFTAEMESE 
LDSVEDGDKE WKAVMRDFYS SFAGVLKKAE ESIGDVELPV EVSDVQCDKC GRYMVVKHGR 
FGKFLACPGF PECRNAKPIV EEAGVECPIC KGKVLIKKTK KGRKYIGCEK NPECPFMSWD 
MPSPNKEVCS VCGSFMLQKF SGKKKVLKCS NDKCTSNIEA SKDNTK