Gene NATL1_21441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21441
Symbol	dnaB
ID	4780757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1801292
End bp	1802710
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	38%
IMG OID	640085441
Product	DnaB replicative helicase
Protein accession	YP_001015964
Protein GI	124026849
COG category	[L] Replication, recombination and repair
COG ID	[COG0305] Replicative DNA helicase
TIGRFAM ID	[TIGR00665] replicative DNA helicase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAGCA CCCCCTCTTC AAATAACGGG GATTTTTCAA AGCAAGGTAG AGATTTTGGA 
GCTTTTAATA ATTCCAAGAT TGAGAATCCT CGTTTTGAAG CTCAACCTGA CCAAATACCA 
CCACAAAATT TAGAAGCAGA AGAATCTGTT CTTGGTGGAA TTTTATTGGA TCCTGATGCG 
ATAGGACGAA TAGCTGATTT GCTACAAGTT GAAGCTTTTT ACATATCTGC TCATCGAGAA 
ATATATAGAA CTGCATTAAT GCTTCATAGC CAGGGCAAGC CTACAGATTT AACAGCAATG 
AGCGCTTGGC TTGCGGATAC AAATTCTTTA GAAAAAGTTG GAGGCAACAA CCGATTAGTT 
GAACTTGTTG AGCGGGTTAC ATCTACAGCT TCAATCGAAC AAGTTGCTAA ATTAATTAGC 
GATAAATTTC TGCGCAGACA ATTAATTAAA TCTGGAAATG ATGTAATCAA ATTAGGCTTT 
GATCAAAGTC TGCCCATGGA AGAAGCCATT GATCAAGCTG AACAAAAGAT CTTTGCTATT 
AGCCAAGAGC AACCATCCAA AGGTCTAACA CCCACAGCAG AAATTTTGAC AAGTACTTTC 
AATGAAATAG AGAGTAGATC ACTTGGTACA TCAGTAGCAG GCATACCAGT TAATTTTTAC 
GATCTGGATG CAATGACACA AGGACTGCAG CGGAGCGATC TAATAATTGT TGCAGGAAGA 
CCAGCAATGG GAAAAACTTC AATTGTTCTT AATTTGGCTA AAAACGTTGC ACAACTACAT 
GACTTACCTG TTTGTGTATT CAGTCTTGAG ATGAGTAAAG AGCAACTAAC TTACAGATTG 
CTATCAAGCG AGGTAGGTAT TGAGAGCAGT AGATTAAGAA CGGGACGTTT GCAACAAGAT 
GAATGGCCAT TACTTGGTCA AGGTATTAAT ACGCTTGGTC AATTACCAAT CTTCATTGAT 
GACAAGCCAA ATTCCAGTGT TCTTGAGATG AGGTCCTTAT GTCGTCGCCT AATTGCTGAA 
CAAGGTAAAG AGCTTGGACT CATTGTGATT GATTATCTTC AACTAATGGA AGGTACTTCT 
CCAGATAATC GAGTTCAAGA AATTTCAAGG ATTACTAGAG GCCTTAAGGG TATGGCAAGA 
GAACTTAAAG TGCCTGTAAT CGCTTTATCT CAATTAAGTA GAGGAGTTGA ATCAAGAACC 
AATAAAAGAC CAATGCTTAG CGATCTGCGT GAATCTGGCT CAATAGAACA GGATGCGGAC 
TTGGTTCTAA TGATTTATAG AGATGAATAT TACAATCCAG AAACTACTGA TAGAGGAATT 
ACAGAAGTTA TCGTGACAAA GCACCGGAAT GGACCCGTTG GAACAGTTAA ATTACTTTTT 
GAACCCCAAT TCACTAGATT TAGAAATCTT GCTGCTTAA

Protein sequence

MISTPSSNNG DFSKQGRDFG AFNNSKIENP RFEAQPDQIP PQNLEAEESV LGGILLDPDA 
IGRIADLLQV EAFYISAHRE IYRTALMLHS QGKPTDLTAM SAWLADTNSL EKVGGNNRLV 
ELVERVTSTA SIEQVAKLIS DKFLRRQLIK SGNDVIKLGF DQSLPMEEAI DQAEQKIFAI 
SQEQPSKGLT PTAEILTSTF NEIESRSLGT SVAGIPVNFY DLDAMTQGLQ RSDLIIVAGR 
PAMGKTSIVL NLAKNVAQLH DLPVCVFSLE MSKEQLTYRL LSSEVGIESS RLRTGRLQQD 
EWPLLGQGIN TLGQLPIFID DKPNSSVLEM RSLCRRLIAE QGKELGLIVI DYLQLMEGTS 
PDNRVQEISR ITRGLKGMAR ELKVPVIALS QLSRGVESRT NKRPMLSDLR ESGSIEQDAD 
LVLMIYRDEY YNPETTDRGI TEVIVTKHRN GPVGTVKLLF EPQFTRFRNL AA