Gene GM21_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0001
Symbol	dnaA
ID	8139527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	119
End bp	1501
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	54%
IMG OID	644867618
Product	chromosomal replication initiation protein
Protein accession	YP_003019846
Protein GI	253698657
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAATA TTTGGCTGGA AGCCCAGACA AATCTTAAGC AAGTATTAAC CGAACAGACA 
TACAGTACGT GGATCGACCC GTTGAAGTTC CTGGGTGCCA CAGTTGACAC CATAGTCCTC 
GAAGTCCCCA GTTCGTTCTT TCAAAAATGG GTCACTGACA AATATCTGGC AATGATCAAG 
GAAGCCATCT CCGCGGTCAA CGGCAAAAGC TACCAGATAG AGTTCCATGT CGCCGATGAG 
AAGCCGGAGG CGGCTCCCGA GGAAAAGCCC GAAAAAGAGG GGAAACCTGC CAGGGAGAAA 
GAAAAGGATA AGGACAAGGA AAAAGAGAAG GATAGAGAAA AGGAGAAGGA CAAGAAGGAG 
CTGGTTCCCA ATCTGAACCC CAAGTACACC TTCGAGTCTT TCGTCTCGGG TCCCAGCAAC 
CAGTTCGCTT ATGCAGCTTC CCAGGCGGTG GCGAACAAGC CGGCCACCAA TTACAACCCG 
CTCTTCATCT ACGGCGGGGT GGGCCTCGGC AAGACGCACC TGGTCAACGC CATCGGCAAC 
CATATCCTGG CCAAGAACCC GAAGGCGAAG ATCTGCTACT ACTCCTCAGA GAAGTTCATG 
AACGAGATGA TCAACTCGCT CCGATACAAG AAGATGGACG AGTTCCGCAA CAAGTTCAGG 
AAAATGGACC TGCTGCTCAT CGACGACATA CAGTTCATGG CCGGAAAAGA GGCGACGCAG 
GAAGAGTTCT TCCACACCTT CAACGCGCTC TACGAGTCGC ACAAGCAGAT CGTGGTCACC 
TCCGACAAGT TTCCCAAGGA CATCCCGGGG CTAGAGGAGC GGTTGAGAAG CCGTTTCGAA 
TGGGGGCTGA TCGCCGACAT ACAGCCGCCG GGGGTGGAGA CCAAGGTCGC CATTCTCAAG 
AAGAAGTCCG ACATGCACGC GGTCAACCTC CCCGACGACG TGGCGCTCTT TCTCGCGGAA 
GGTGCGAACA GCAACATCCG CGAGCTGGAG GGGATGCTGA TCAGGCTGGA GGCGTTTGCA 
AGCCTCACCG GTCAGGAGAT AACGCTCAGC ATGGCCCGCG AGGTGATGAA GGACATCATC 
GTCGAGAAGA CACGCGACAT CACCGTCGAG ATGATACAGA AGACCGTTGC GGAGCATTTC 
CGCATCAAGG TGTCGGAGCT TAAGTCGGAC AAAAGGATCA AGACCCTCGT GGTTCCGCGC 
CAGATAGCGA TCTACATCTG CCGCGAGCTC ACCAAGGCGT CCTACCCGGA AATAGGCGAG 
AAGTTCGGCG GGAAGGACCA CTCCACCATC ATCCATTCGG TGAAGAAGAT AGAAAAGCAG 
ATGGCGGGCG ACGATGAGTT TAAGGCGTCT GTGGAAGACA TAAGGAAAAA GCTGTTCACT 
TAA

Protein sequence

MENIWLEAQT NLKQVLTEQT YSTWIDPLKF LGATVDTIVL EVPSSFFQKW VTDKYLAMIK 
EAISAVNGKS YQIEFHVADE KPEAAPEEKP EKEGKPAREK EKDKDKEKEK DREKEKDKKE 
LVPNLNPKYT FESFVSGPSN QFAYAASQAV ANKPATNYNP LFIYGGVGLG KTHLVNAIGN 
HILAKNPKAK ICYYSSEKFM NEMINSLRYK KMDEFRNKFR KMDLLLIDDI QFMAGKEATQ 
EEFFHTFNAL YESHKQIVVT SDKFPKDIPG LEERLRSRFE WGLIADIQPP GVETKVAILK 
KKSDMHAVNL PDDVALFLAE GANSNIRELE GMLIRLEAFA SLTGQEITLS MAREVMKDII 
VEKTRDITVE MIQKTVAEHF RIKVSELKSD KRIKTLVVPR QIAIYICREL TKASYPEIGE 
KFGGKDHSTI IHSVKKIEKQ MAGDDEFKAS VEDIRKKLFT