Gene Moth_0002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0002
Symbol	dnaA
ID	3831312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	450
End bp	1778
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	49%
IMG OID	637827929
Product	chromosomal replication initiation protein
Protein accession	YP_428885
Protein GI	83588876
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0135977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000101386
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGGCTCCTG TACAGCTCGA TCTGGCCTGG CAACAGGCCT TAACGATTCT CGAAAAACAG 
GTCAGCACCC CTGCCCTGGA AACATGGTTT TACGAAGCCC GGCCGGTTAC CATGCAGGGC 
AATACCCTGG TCCTGGCTGT AGCCAACGAA TTTGCCCGGG ACTACATCCA GAGCCGCTAT 
TATCCCCTTA TCCAGGAAGC ACTGCAACAG GTCCTGGGGC GAAAAATTAT CAAAATCCAG 
GTAATCTGCT TCCCTCTCTC AAGTTCAAAC CAGCGCCAGG AACCGGAACT GGAGGATCCC 
AGTCTCCCCC CCCTCAACCC TAAATATACC TTTGAAACCT TTGTTGTGGG TAACAGCAAC 
CGTTTTGCCC ATGCAGCCTG CCTGGCCGTA GCCGAATCGC CAGCCAGTTC TTATAATCCG 
CTATTTATCT ACGGGGGCGT AGGTCTTGGC AAAACCCACC TGATGCAGGC CATCGGCCAT 
CGGGTTCGCC AGCATTTACC AGAACTCCGG GTAATGTACA TCTCTTCGGA AAAATTCACG 
AACGACTTGA TTAATGCTAT TAAGGATAAG GCTACAGAAC AGTTCCGCAC CAAGTATCGC 
AATATCGATG TTTTATTAAT TGATGATATC CAATTTTTAG CAAAAAAAGA GAGTACCCAG 
GAAGAGTTCT TCCATACTTT TAATCATTTA TATGAGGCAA ATAAACAAAT AATCATCTCC 
AGTGACCGGC CGCCCAAGGA AATTCCCACC CTGGAAGACC GCCTGCGTTC CCGCTTCGAG 
TGGGGCCTGA TCACCGATAT CCAACCGCCT GATCTGGAAA CCAGGATGGC TATTTTACGC 
AAAAAAGCTG TTGCCGAGGG TATTAACCTG CCGGATGAAG TCATGTTCTT TATAGCTCAA 
AAAATTGATT CTAACATTCG AGAGCTGGAG GGGGCCCTCA TCCGGGTTGC TGCTTACGCC 
AATTTTACCA AAAAAGAAAT AACCCCCGGG CTGGCAGAAG AGATTTTAAA AGACGTTCTC 
GACCTGGCGC GACCTAAACC GATTACCATT CGTTTAATCC AGGAGACAGT AGCTAATTAC 
TTCAATTTGA AGGTAGAAGA TCTAAAAGCC AAGAAGCGCA CGCGTTCCGT GGCTTACCCC 
CGTCAAATTG CCATGTACCT CTGTCGGGAA CTAACCGAAT CCTCCCTGCC GGATATCGGT 
AAGGAATTTG GCGGCCGGGA TCATACTACT GTTCTCCACG CCTACGACAA GATTCGCGAC 
GACCTAAACA CAGATCCTTC CCTTCCCCAG GTAATAGCCC AGATAAGGCA ACAGCTTAGA 
AACCAGTAA

Protein sequence

MAPVQLDLAW QQALTILEKQ VSTPALETWF YEARPVTMQG NTLVLAVANE FARDYIQSRY 
YPLIQEALQQ VLGRKIIKIQ VICFPLSSSN QRQEPELEDP SLPPLNPKYT FETFVVGNSN 
RFAHAACLAV AESPASSYNP LFIYGGVGLG KTHLMQAIGH RVRQHLPELR VMYISSEKFT 
NDLINAIKDK ATEQFRTKYR NIDVLLIDDI QFLAKKESTQ EEFFHTFNHL YEANKQIIIS 
SDRPPKEIPT LEDRLRSRFE WGLITDIQPP DLETRMAILR KKAVAEGINL PDEVMFFIAQ 
KIDSNIRELE GALIRVAAYA NFTKKEITPG LAEEILKDVL DLARPKPITI RLIQETVANY 
FNLKVEDLKA KKRTRSVAYP RQIAMYLCRE LTESSLPDIG KEFGGRDHTT VLHAYDKIRD 
DLNTDPSLPQ VIAQIRQQLR NQ