Gene Athe_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0001
Symbol
ID	7408339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	45
End bp	1409
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	38%
IMG OID	643714415
Product	chromosomal replication initiator protein DnaA
Protein accession	YP_002571940
Protein GI	222528058
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000331762
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGAAT ATGACGTGAA CGAAGTGTGG GAAAAGATAA AGGAGGCTGT GAAAAAAGAA 
ATAAATCCAA GTCCGACAGA TATATCATAT AACACATGGT TTGAATCGCT TGTACCTCTT 
TGTTTTGACG ACAATGATAC ATTGATTTTA AAAGCATTTG CTGATTTTCA CAGGGATATA 
GTAATAAACA GGTATTCACT TGTCATTTTA AATGCTATAA GGCAGCTATT TTCACCGCAT 
CTCAGCATAA AAGTAATTCT TCCTGATGAG GTTGAAAAGT ACAAAAGGTT TCTAAAACCA 
AAGCAAGACG AAAAACCAGA GATAGTAACA CAGCTAAATC CCAAATATAC TTTTGAAACC 
TTTGTTGTTG GGAACAACAA CAGACTTGCA CATGCCGCAG CACTGGCCGT GGCAGAAACA 
CCACCGGGTG AGAGAACCTA TAACCCACTT TTTATTTATG GCGGTGTCGG GCTTGGAAAG 
ACTCATCTTA TGCATGCAAT AGGTCATCAC GTTTTAAAGC TTTATCCTGG CACAAAGGTT 
ATGTATGTTA CATCAGAGAT ATTCACAAAC GAGCTTATAG CCGCAATAAG AGATGAAAAG 
ACAGACGAGT TTAGGCTCAA GTACAGAAAC GTCGATGTTC TTTTAATTGA CGACATTCAG 
TTTTTAGGCG GAAAGGAAAG AACACAAGAA GAGTTTTTCC ACACCTTCAA CACTTTGTAT 
GAGGCAAACA AGAAGATAAT ACTTTCATCA GACAGGCCAC CAAAAGAAAT AAACACCTTA 
GAAGACAGGC TCCGCTCTCG TTTTGAATGG GGACTTATAA CAGACATTCA GCCGCCAGAC 
TTTGAGACGC GAATAGCAAT TTTGAGCAAA AAATGCCAGC TTGAAGGAAC ACCTGTGCCA 
CAGCATATTT TAGAGTTTAT AGCATCAAAG ATTGAAACAA ACATAAGAGA ACTCGAAGGT 
GCTCTCAATA AAATTCTTGC ATATTCAAAG CTAATGGCTC CTGATAAAGA AATAACATTA 
GATCTTGCTG AAAAGGCTTT GAAAGAGTTT ATCGACACAA ACACAAAAAA AGAGCTCACA 
ATAGAGGATA TCCAGGCAGA AGTTGCAAGC TATTTTGGTA TTCGGCTTGA AGATTTTAAA 
TCATCAAGAA GGTCAAGAAA CGTAGCATTC CCGCGACAGA TAGCTATGTA TTTAGCAAGG 
GAACTTACAA ATGTATCGCT TCCTAAAATA GGCGAGGCGT TTGGCGGAAA GGACCACACT 
ACAGTACTTC ATGCCTGTGA AAAAATCAAG GAACTTATCA ACACAGATTC AAACACAAAA 
AATACTGTTG AAACAATCAA AAAAAGACTT ATCCACAGAG AATAA

Protein sequence

MVEYDVNEVW EKIKEAVKKE INPSPTDISY NTWFESLVPL CFDDNDTLIL KAFADFHRDI 
VINRYSLVIL NAIRQLFSPH LSIKVILPDE VEKYKRFLKP KQDEKPEIVT QLNPKYTFET 
FVVGNNNRLA HAAALAVAET PPGERTYNPL FIYGGVGLGK THLMHAIGHH VLKLYPGTKV 
MYVTSEIFTN ELIAAIRDEK TDEFRLKYRN VDVLLIDDIQ FLGGKERTQE EFFHTFNTLY 
EANKKIILSS DRPPKEINTL EDRLRSRFEW GLITDIQPPD FETRIAILSK KCQLEGTPVP 
QHILEFIASK IETNIRELEG ALNKILAYSK LMAPDKEITL DLAEKALKEF IDTNTKKELT 
IEDIQAEVAS YFGIRLEDFK SSRRSRNVAF PRQIAMYLAR ELTNVSLPKI GEAFGGKDHT 
TVLHACEKIK ELINTDSNTK NTVETIKKRL IHRE