Gene Cthe_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2371
Symbol	dnaA
ID	4809009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2834293
End bp	2835624
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	42%
IMG OID	640107782
Product	chromosomal replication initiation protein
Protein accession	YP_001038766
Protein GI	125974856
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0166544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTC AGTTGAATGA AATATGGCAA AAAACTTTAG GACTGCTTAA AAATGAGCTT 
ACAGAAATCA GTTTTAACAC CTGGATCAAG ACCATCGATC CATTGTCCTT GACAGGCAAT 
ACTATAAACC TGGCTGTCCC GGCGGAATTC AACAAGGGAA TTCTTGAGTC CAGGTATCAA 
ACTCTGATTA AAAATGCCAT TAAGCAAGTT ACTTTTAAGG AATACGAGAT TGCATTTATC 
GTGCCTTCAC AGGAAAATTT AAACAAGCTG ACGAAGCAGA CCGAGTCCGC CGGCAATGAG 
GATTCTCCTT TGTCAGTATT AAACCCGAAG TACACGTTTG ACACTTTTGT CATAGGAAAC 
AGCAACAGAT TTGCACACGC AGCCGCACTG GCCGTGGCCG AGGCACCGGG AAAAGCATAC 
AATCCCTTGT TCATATATGG CGGAGTGGGA CTTGGGAAGA CTCATCTTAT GCATGCCATC 
GGGCACTACA TTCTGGAACA GAATTCTTCC CAAAAGGTTT TGTATGTTTC ATCTGAAAAA 
TTTACCAACG AACTTATCAA TGCCATTAAA GACAACAGAA ATGAAGAATT CAGATCCAAA 
TACAGAAATA TTGACGTACT GCTTATAGAC GACATACAAT TCATTGCCGG AAAGGAAAGA 
ACGGAGGAGG AGTTCTTCCA TACCTTCAAT GCTCTTTACG AAGCAAACAA ACAGATAATC 
CTGTCAAGCG ACAAGCCTCC GAAAGAAATT TCTCTTGAGG ACCGCCTGAG ATCCAGGTTT 
GAATGGGGCT TGATTGCGGA CATGCAGGCA CCGGATCTGG AAACCAGGAT AGCAATACTA 
AGGAAAAAAG CCCAGCTTGA AAACCTTACT GTTCCAAATG AAGTAATTGT ATTCATTGCA 
GACAAGATAG CATCAAACAT CAGAGAACTT GAAGGTGCCT TAAACAGAGT AATAGCATAT 
TCATCGCTTA CGGAAAACGA AATTACCGTC GAACTCGCCA GCGAAGCATT AAAAGACATA 
CTGTCAGCAA ACAAGGCGAA AGTTTTAAAC TGCACCACAA TCCAGGAAGC AGTGGCCAGA 
TACTTTGACA TAAGACCGGA AGAATTTAAA TCAAAGAAGA GGACAAGGGA CATCGCATTC 
CCAAGACAAA TTGCAATGTA CCTGTGCAGA GAACTTACCG AAATGTCCCT CCCAAAAATC 
GGCGAGGAAT TCGGCGGAAG AGATCATACT ACTGTAATAC ATGCATGTGA AAAGATAAGT 
GAAGAAATCG AAAGCAACTC CGAAACCAGG AGGGCCGTAA GTGAAATAAA GAGGAACCTG 
CTGGGAAAAT AA

Protein sequence

MNTQLNEIWQ KTLGLLKNEL TEISFNTWIK TIDPLSLTGN TINLAVPAEF NKGILESRYQ 
TLIKNAIKQV TFKEYEIAFI VPSQENLNKL TKQTESAGNE DSPLSVLNPK YTFDTFVIGN 
SNRFAHAAAL AVAEAPGKAY NPLFIYGGVG LGKTHLMHAI GHYILEQNSS QKVLYVSSEK 
FTNELINAIK DNRNEEFRSK YRNIDVLLID DIQFIAGKER TEEEFFHTFN ALYEANKQII 
LSSDKPPKEI SLEDRLRSRF EWGLIADMQA PDLETRIAIL RKKAQLENLT VPNEVIVFIA 
DKIASNIREL EGALNRVIAY SSLTENEITV ELASEALKDI LSANKAKVLN CTTIQEAVAR 
YFDIRPEEFK SKKRTRDIAF PRQIAMYLCR ELTEMSLPKI GEEFGGRDHT TVIHACEKIS 
EEIESNSETR RAVSEIKRNL LGK