Gene P9515_07721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9515_07721
Symbol	hcaE
ID	4719437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9515
Kingdom	Bacteria
Replicon accession	NC_008817
Strand	+
Start bp	699308
End bp	700627
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	26%
IMG OID	640080451
Product	Rieske iron-sulfur protein 2Fe-2S subunit
Protein accession	YP_001011088
Protein GI	123966007
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.725202
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATA AGCAAATTAA TTTTTTTAAA GCTAAAGATA TTAATACCGT TTTAAAACCT 
TATAAAAAGG GTACTGTAGT TAATATCGAT AACTTTGAGG CGAGAGAAAG ACAAAAAGAA 
TTAAAGACAG GTTTATATGG ATGGTATGCA ATTTGCCCTT CAAATGTACT TAAGAAAAAT 
AAGATTCATT ATTTCTCCTT ATTTGATGAA CCTCTTCTTC TATTTAGAGA CAATAAAAAT 
AATGTAAGAT GTATCAAAAA TATTTGTCCC CATAGGGGGG CCTCTTTTTA TGGTGGATCA 
ATTTCTAATG GAGAATTAAC TTGCCCATAC CATGGAGCAA GATTCAGTTC TGAAGGTAAT 
TGTCAGAATA TTGATAGCAT AACTTGTAGA CATATTGTTG ATAATAATTA TGATAATTAT 
GCTAAGAGGA TACACTTATC TCAATACAAA ACAGTAGAAG AGGATAACTA CATTTTTATA 
TATTTTTCCG ATAAGTCTGA GATGGATTTG AATAATATTA AAGAAGAGCC ATCAATTAGT 
AATTATGAAT TAATTAGTAA CGGATTTTCT ATTGAAGACT CAGTATCAGA AGAGGTTTTA 
GTTGATTTTA AATGTGATTG GTCAAGAATA ATTGAAAATC ATTTAGATAT TCTTCACATA 
TTTTGGGTAC ATGGAGATAC AATTCCAGAT AAAGAAGTAA ATAAAAATGT TTTGGTAAGT 
TTTAATCAGA AAATAAATAT CAATCCAAAT TATATTGAAA GCATATATTT CTATAAAAAA 
AATCCAACAA AAGAATTTAT AAGAATAAAG TATATTCCTC CAGGAAGAAT TTTAATTTAT 
AAGGGAGATC CAGCTGTTTC AAGGTATGTT CAAGTGCTTG ATCATATCCC CTTAGGCGAA 
AATAAAGCAA GAGTAATTGT TAGACATTAC AGGAAATTTC TTAAAAACAA ATTACTTAAT 
AACCTAATAT TGTTTAAAGA AAATCAAAAA AAGATTTTTT ATAAAATTTT TAATGAAGAT 
TACATGATTC TTAAAACCCA GACTTACAAT CATAAGATGG GATTAATAAA AAATGATGAG 
ATAAAACTAC TTGGTGAAGA TAGAATGATT AATTATTTCT GGAATTGGTA TAAAAAATCG 
GAAGAAAAGG ATACTCCATG GAAATATATA AATAATAAAG AACTTAACGT TTATGATGAA 
ATTATATTTA AATATCCTCC CGAAATTAAG AAATTAGAAG TAATTAATAA TATCAATATA 
ATAAGAAAAG CATTTATAAG ATATGCTGCC CCACTTATCT TTTTACTGCT AATAATATAA

Protein sequence

MENKQINFFK AKDINTVLKP YKKGTVVNID NFEARERQKE LKTGLYGWYA ICPSNVLKKN 
KIHYFSLFDE PLLLFRDNKN NVRCIKNICP HRGASFYGGS ISNGELTCPY HGARFSSEGN 
CQNIDSITCR HIVDNNYDNY AKRIHLSQYK TVEEDNYIFI YFSDKSEMDL NNIKEEPSIS 
NYELISNGFS IEDSVSEEVL VDFKCDWSRI IENHLDILHI FWVHGDTIPD KEVNKNVLVS 
FNQKININPN YIESIYFYKK NPTKEFIRIK YIPPGRILIY KGDPAVSRYV QVLDHIPLGE 
NKARVIVRHY RKFLKNKLLN NLILFKENQK KIFYKIFNED YMILKTQTYN HKMGLIKNDE 
IKLLGEDRMI NYFWNWYKKS EEKDTPWKYI NNKELNVYDE IIFKYPPEIK KLEVINNINI 
IRKAFIRYAA PLIFLLLII