Gene NATL1_21811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21811
Symbol	acnB
ID	4780291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1839141
End bp	1841741
Gene Length	2601 bp
Protein Length	866 aa
Translation table	11
GC content	38%
IMG OID	640085479
Product	bifunctional aconitate hydratase 2/2-methylisocitrate dehydratase
Protein accession	YP_001016001
Protein GI	124026886
COG category	[C] Energy production and conversion
COG ID	[COG1049] Aconitase B
TIGRFAM ID	[TIGR00117] aconitate hydratase 2

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.24059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAAAAG ATTATTTATC ACATGTTGCA GAAAGAGAAG CTTTGGGGAT TCCTCCACTT 
CCTTTAGATG CAAAACAGAC TCAAGTTTTA ACAGAGTTAT TAGAAAAACC AGATCAAGGT 
ATCGATCAAA ACTTCTTACT TGATCTTCTT GTTAATCGAA TTCCTCCCGG AGTTGATCAA 
GCCTCTTATG TCAAAGCGAC TTGGCTTAGC TCAATTGCTC AAGAAGAATC AAAAAGTCCG 
TTAGTAAATC CTCTAAAAGC AACTGAGCTT TTAGGTACAA TGATTGGCGG ATATAATGTA 
GCAGCGTTAA TTGAAATACT AAAATCTAAT AATAAAGAAT TAGCGACTTC AGCCTGTTGT 
GCATTAAGTA ATACCCTTTT AGTTTATGAC GCTTTAAACG ACATTTTAGA ATTAGCAAAA 
ACTAATATTT ATGCAGAAAA AGTTATCAAT AGCTGGTCCA ATGGAGAATG GTTCACTAAT 
AAACAACCAT TAGCTCAAGA AATAACAGTA ACAGTATTTA AAGTTGAAGG AGAAACAAAT 
ACAGACGACC TCTCTCCAGC AACTCATGCC ACAACAAGAC CAGATATTCC TTTACATGCT 
CTAGCGATGC TAGAGACTCG AGATCCAAAT GGTTTAAGCA CTATTGAAGA ATTAAAAAAG 
AAAGGATATC CAATTGCATA TGTTGGCGAT GTCGTTGGAA CAGGAAGCTC TAGAAAGTCA 
GCAATTAACT CAGTTCTTTG GCATACAGGA CAAGACATAC CTTACGTACC AAATAAAAGA 
GGGAGTGGGG TTGTAATAGG AGGCAAAATT GCTCCTATTT TCTTTAATAC TGCTGAAGAT 
TCAGGTGCGC TTCCAATTGA ATGCGATGTA AGCAATCTCA AAACAGGTGA TGTAATTACT 
ATTTTCCCTT ACAAAGGAGA AGTTAGAAGA AGTAAAAATA AGACAAACAG TGGAGAACTT 
CTATCAAAAT TTGACTTAAA ACCACAAACT ATTACTGATG AAGTAAGAGC GGGTGGGCGA 
ATTCCTTTAA TGATTGGAAG AGCTTTGACA GACAAAGTTA GAACAAAATT AAAACTTCCA 
CCCTCTACTC TTTTTATTCG TCCTGGTCAG CCACCTGCAT CAAAGTATGG GTTTACACAA 
GCTCAAAAAA TGGTTGGAAA AGCTTGCGGT TTAGAAGGCG TTCTCCCTGG TGCAAGTTGT 
GAGCCAATAA TGACAACAGT TGGTAGTCAA GACACTACTG GTCCGATGAC TAGAGATGAA 
ATGAAAGAAT TAGCCTGTTT AGGATTTTCT GCTGATTTAG TTATGCAGAG TTTCTGTCAT 
ACCGCAGCAT ATCCTAAGCC TGTTGATATC AAAACTCAAA AAGAACTCCC TGATTTTTTT 
GCTGAAAGAG GAGGAATAGC ATTAAAACCC GGTGATGGAA TTATTCACAG TTGGCTAAAC 
AGGATGCTTT TGCCGGACAC AGTCGGGACA GGTGGCGATA GTCATACACG ATTCCCGTTG 
GGCATCTCAT TTCCAGGAGG TTCGGGAGTG GTGGCATTTG CGGCAGCCAT TGGTTCCATG 
CCTTTAGATA TGCCAGAGTC AGTTCTTGTT CGTTTTAAAG GGTCTTTACA AACTGGTGTC 
ACTTTAAGAG ATGTAGTTAA TGCCATTCCG TGGATGGCCA TACAAAAAGG TCTTCTGACC 
GTCGCAAAAG CAAACAAAGT TAATGTGTTC AATGGAAAGA TATTAGAAAT TGAAGGTCTA 
CCAAACCTAA AATTAGAGCA AGCCTTTGAG TTGACTGATG CAAGTGCAGA AAGATCTTGT 
GCTGGATGTA CTATTCAACT GTCTGAATCA ACAATCAGTG AATATTTAAA AAGCAATATT 
GTTTTACTTA AAAATATGAT TGCTAGGGGA TATAAAGATG CCCGAACAAT AAGTAGAAGA 
ATTAAAGAAA TGGAAGATTG GTTAAAAAAA CCAAATTTAC TATCAGCCGA CTCAAATGCT 
CAATACTCAG AAACCATCGA AATAGACTTG AATAAACTGA AAGAACCTGT TTTAGCTTGC 
CCTAATGATC CTGATAACGT CAAACTTTTA AGCGAAGTCG CAGGCACTCC CATTCAAGAA 
GTTTTTATTG GTTCGTGTAT GACTAATATT GGTCATTATC GAGCCGCTGC AAAAATTCTC 
GAAGGAGAGG GGAAGATATC AGCACGATTA TGGGTATGTC CGCCAACACG AATGGACGAA 
GAAATTTTGA AAAAAGAAGG ATACTACGAG ATTTTTGAAA AAGCTGGTAG CCGAATGGAA 
ATGCCTGGTT GTTCTCTATG CATGGGCAAT CAAGCTCGTG TAGAAGATAA TTCAACTGTT 
TTCTCAACAA GTACAAGAAA TTTCAACAAC AGATTAGGAA AAGGAGCTCA AGTGTTCTTA 
GGAAGTGCAG AATTGGCTGC TGTTTGCGCT TTGATAGGTC ATATCCCTAC AACTGATGAA 
TATCTTGCAA TAGCTTCCAA AAAAGTTTCA CCAATAACTG ACGAAATCTA CAGATACTTA 
AACTTTAATG AAATACCAAA CTTTATCGAA GATGGTCGTG TAATAACAAA AGAAGAAGAG 
GCCTCTATTT TACAAACCTA A

Protein sequence

MLKDYLSHVA EREALGIPPL PLDAKQTQVL TELLEKPDQG IDQNFLLDLL VNRIPPGVDQ 
ASYVKATWLS SIAQEESKSP LVNPLKATEL LGTMIGGYNV AALIEILKSN NKELATSACC 
ALSNTLLVYD ALNDILELAK TNIYAEKVIN SWSNGEWFTN KQPLAQEITV TVFKVEGETN 
TDDLSPATHA TTRPDIPLHA LAMLETRDPN GLSTIEELKK KGYPIAYVGD VVGTGSSRKS 
AINSVLWHTG QDIPYVPNKR GSGVVIGGKI APIFFNTAED SGALPIECDV SNLKTGDVIT 
IFPYKGEVRR SKNKTNSGEL LSKFDLKPQT ITDEVRAGGR IPLMIGRALT DKVRTKLKLP 
PSTLFIRPGQ PPASKYGFTQ AQKMVGKACG LEGVLPGASC EPIMTTVGSQ DTTGPMTRDE 
MKELACLGFS ADLVMQSFCH TAAYPKPVDI KTQKELPDFF AERGGIALKP GDGIIHSWLN 
RMLLPDTVGT GGDSHTRFPL GISFPGGSGV VAFAAAIGSM PLDMPESVLV RFKGSLQTGV 
TLRDVVNAIP WMAIQKGLLT VAKANKVNVF NGKILEIEGL PNLKLEQAFE LTDASAERSC 
AGCTIQLSES TISEYLKSNI VLLKNMIARG YKDARTISRR IKEMEDWLKK PNLLSADSNA 
QYSETIEIDL NKLKEPVLAC PNDPDNVKLL SEVAGTPIQE VFIGSCMTNI GHYRAAAKIL 
EGEGKISARL WVCPPTRMDE EILKKEGYYE IFEKAGSRME MPGCSLCMGN QARVEDNSTV 
FSTSTRNFNN RLGKGAQVFL GSAELAAVCA LIGHIPTTDE YLAIASKKVS PITDEIYRYL 
NFNEIPNFIE DGRVITKEEE ASILQT