Gene P9301_08691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_08691
Symbol	hcaE
ID	4911016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	752828
End bp	754150
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	28%
IMG OID	640160451
Product	Rieske iron-sulfur protein 2Fe-2S subunit
Protein accession	YP_001091093
Protein GI	126696207
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACA GACAAATTAA TTTTTTTAAA TCAAAAGACT TTAATACCGT TCTTAAGCCA 
TTTAAAAAAG GAACGGTAGT AAAAATTGAC TCGTTTGATA TTAGAGAAAA TCAAAAAGAA 
TTAAATATAG GTTTATTTGG TTGGTATGCA ATTTGTCCCT CTAAAGAACT AAAAAAAAAT 
AAGCTTTATT ATTTTTCACT CTATGATGAG CCGCTTGTTC TTTATAGAGA TGAAAATAAA 
AACGTAAGGT GTATTAAAAA TATTTGTCCA CACCGAGGAG CCTCCTTTTT TGGAGGAACA 
TTATCAGGTG GAGTAATAAC CTGCCCATAT CATGGAGCTA AGTTTTCATC TGGAGGAAGT 
TGCCAAAATC TCGACAGAAT AACATGTCGC CATATAGTTG ATAATAACTA CGATAACTAC 
GCTAAAAGAA TTCATTTATC TCAATACAAA ACCTCAGAAA AAAATGGATA TATTTTTGTA 
CATTTTTCTA AAAAATCTGA GACTGATTTA AATAACATAA ATGAAGATAC ACCTGTAAGT 
AACTACGAAT TATATGAAAA TGGATTTGCA CATAAGGATT ATGTCTTTGA GGAGGTATTA 
GTTGACTTTA AATGTGATTG GTCAAGGATT ATTGAAAATC ACCTAGATAT TCTTCATATC 
TTTTGGGTTC ATGGCGATAC AATTCCTGAT AAAGATGTGA ATAAAAACGT ACTTGTTAGT 
TTTAACCAGA AAATTAATAT TAATCCCAAA TACATTGAAA GTATTTATTA TTACAAGAAT 
GACCCTACAA AAGAATTTAT TCGGATAAAA TACATACCTC CAGGAAGGAT ATTAATCTAC 
AAAGGTGATC CTTCCTCATC AAGATATTTA CAAGTTTTAG ATCATATTCC TCTAGGAAAA 
AACAAAGCAA GAGTAATAGT AAGACACTAT AGGAAATTTC TACAAAATAA ACTACTTAAT 
AACCTCTTAT TATTTAAAGA GACTCAAAGA AAGATTTTTT ATAAGATATT TGATGAGGAT 
TATATGATTT TAAAAACACA AACATATAAT CACGATATGG GATTTATTAG TAAGGATGAA 
ATAAAATTAT TGGGAGAAGA TAGAATAATA AATTATTTTT GGAAGTGGTA CAAGAGGTCT 
GAAGATAATG ATAAACCATG GAAAAATAAT AACAAAACCC AAAATCTTGA TGTATATGAC 
AAAGTGATAT TGAAATATCC TCCTGAGATA AAGAAGTTAG AAATTGCAAA TAATATAGAT 
ATTATTAGAA AAACAATCGT AAGATTTGCT GCTCCGCTTA TATTTTTCAT GTTAATAATA 
TAA

Protein sequence

MENRQINFFK SKDFNTVLKP FKKGTVVKID SFDIRENQKE LNIGLFGWYA ICPSKELKKN 
KLYYFSLYDE PLVLYRDENK NVRCIKNICP HRGASFFGGT LSGGVITCPY HGAKFSSGGS 
CQNLDRITCR HIVDNNYDNY AKRIHLSQYK TSEKNGYIFV HFSKKSETDL NNINEDTPVS 
NYELYENGFA HKDYVFEEVL VDFKCDWSRI IENHLDILHI FWVHGDTIPD KDVNKNVLVS 
FNQKININPK YIESIYYYKN DPTKEFIRIK YIPPGRILIY KGDPSSSRYL QVLDHIPLGK 
NKARVIVRHY RKFLQNKLLN NLLLFKETQR KIFYKIFDED YMILKTQTYN HDMGFISKDE 
IKLLGEDRII NYFWKWYKRS EDNDKPWKNN NKTQNLDVYD KVILKYPPEI KKLEIANNID 
IIRKTIVRFA APLIFFMLII