Gene NATL1_09401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_09401
Symbol	dnaG
ID	4779445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	867908
End bp	869785
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	35%
IMG OID	640084217
Product	DNA primase
Protein accession	YP_001014763
Protein GI	124025647
COG category	[L] Replication, recombination and repair
COG ID	[COG0358] DNA primase (bacterial type)
TIGRFAM ID	[TIGR01391] DNA primase, catalytic core

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.029627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0569121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTAA TTCCTGGCAA GCAATTTTAT TATTGTTTTT CATGTGGAGC TGGTGGAAAT 
GCAATTAAAT TCTTAATGGA GTTTCAGAGA CAAAGTTTTA GTGATGTTGT TCTTGAGCTG 
GCTAAGAAAT ATCAAGTACC AATTGATACG ATTGAAGGAC CTCAACAAGA AAGACTCAAG 
CAACAGCTTT CACGTAGAGA TACCCTTTAT CGTGTTTTAA AAACCGCTAC TGGTTGGTTT 
AGAAATCAAT TGAATTCTCC ATGTGGAGAA AATGCACTTA ATTACCTTAA GAATAAGCGT 
AATTTAAGTG ATGGAACTTT AATCAATTTT GAACTTGGTT TTGCTCCAGA TAATTGGGAT 
TCACTACTTA AATATTTTGT AGACATAGAA AAAGTCAGTG TTGAAATCCT TGAATCGGCG 
GGATTGATTG TTCCTCGAAA GGGTGGTAAT GGTTTCTATG ACAGATTTCG CAATCGAATA 
ATTGTTCCTA TTCACGACAG GCAAAAAAGA GTTATTGGTT TCGGCGGACG AAGTCTTGAT 
GGTTCAGAAC CTAAGTATTT AAATTCACCT GAGACTGAAA TCTTTGAAAA AGGAAAAAAT 
CTTTTTGGTT TTGATAAATC CACACTTTCC ATTAGGAAAA AAGATTATGC AGTTGTTGTA 
GAGGGATATT TTGATGTGAT GGCACTTCAT GATTCGGGTA TTACAAATGT TGTCGCTTCT 
TTAGGAACAG CTTTAAGTCG CAATCAAATA ACGCTTCTTT CTCGTGCCAC CGATAGTAAA 
AAGATCCTCT TAAATTTTGA CTCAGATAAT GCTGGAATTC GTGCGGCTAA TAGAGCCATT 
AGTGAAGTAG AAAACCTTGC TATTCAAGGT CAACTAGATT TACGAGTCCT TCAATTACCT 
TCAGGTAAAG ATCCAGATGA ATTTCTTAAG GGTAATTCTC CATCCGAATA TGAAGCATTA 
GCGGCAAGAT CACCTCTTTG GATGGATTGG CAAATTGATC AATCATTGAA GGATTTAGAT 
TTAAGTAAAT CTGATCAATT TCAGGAAGCC GTTAGCAGCT TAGTAAGTCT CCTTGGAAAG 
CTTCCTCAAA CTGCAATAAG AACTCATTAT CTACAGAAGG TTGCTCAGCG TCTTAGTGGA 
GGTCAAGGTA GATTCGCTCT ACAACTAGAG GAGGATTTAC GTAATCAAAT AAGTGGTCAA 
AGATGGCACG GTCGCTCGAA AAAAATTGAT AAGCCTCAAG AAATTAGTCT CAGAGAAAGA 
AGTGAGTCAG ATATACTTTT TACTTATATT CACTGTCCTA ATTACAGATC TTTTATTCGT 
TATGAACTTC GCTTAAGGGA TCTTGATGAT TTTGCGATTA ATCATCATCG TGCAATATGG 
TCTACAATAA GTAACATTGA GGAAAATATG TTTGGTCCAG AAACTGTTGA GAAGATTAAT 
CGTTTTAATG ATTCTAATAA TATTTTAGCT GATGTTGATT TAATTAAAAA GTTGTTAGAC 
AATTTCCTAT CCAGTGATAA TGAGCATCTT CCTAAACTTA CTCCTTTACT AGATGTTAAT 
GAACTTCGTT TGGCAACATT AAATGACCCC GAGTCGTTCA TCCGTGGAGC TATGGCTGCT 
CTTGAAAAGC AAAAATCCTT AAAACGTTGT AGACATTTAA TTGATGCATG GAGTTCACAG 
AGATTGCAAA CTCTTGAGAA CTGTATAGCC TCTCTTATTG TTCAGGAAAA ATCTGAGCCT 
AGCGATTCAT CTGATATGGA ACAGAGGGTT ATTAGCATGT TTGAAGACTT AAATAATGAT 
GCTATAAATT TTCAACAACT TTATTACGCT GAAAGAAAAC ACATACTAAA TCTAGATCAA 
CAGAGATGTT ATAAATAA

Protein sequence

MSVIPGKQFY YCFSCGAGGN AIKFLMEFQR QSFSDVVLEL AKKYQVPIDT IEGPQQERLK 
QQLSRRDTLY RVLKTATGWF RNQLNSPCGE NALNYLKNKR NLSDGTLINF ELGFAPDNWD 
SLLKYFVDIE KVSVEILESA GLIVPRKGGN GFYDRFRNRI IVPIHDRQKR VIGFGGRSLD 
GSEPKYLNSP ETEIFEKGKN LFGFDKSTLS IRKKDYAVVV EGYFDVMALH DSGITNVVAS 
LGTALSRNQI TLLSRATDSK KILLNFDSDN AGIRAANRAI SEVENLAIQG QLDLRVLQLP 
SGKDPDEFLK GNSPSEYEAL AARSPLWMDW QIDQSLKDLD LSKSDQFQEA VSSLVSLLGK 
LPQTAIRTHY LQKVAQRLSG GQGRFALQLE EDLRNQISGQ RWHGRSKKID KPQEISLRER 
SESDILFTYI HCPNYRSFIR YELRLRDLDD FAINHHRAIW STISNIEENM FGPETVEKIN 
RFNDSNNILA DVDLIKKLLD NFLSSDNEHL PKLTPLLDVN ELRLATLNDP ESFIRGAMAA 
LEKQKSLKRC RHLIDAWSSQ RLQTLENCIA SLIVQEKSEP SDSSDMEQRV ISMFEDLNND 
AINFQQLYYA ERKHILNLDQ QRCYK