Gene P9211_11131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_11131
Symbol	petH
ID	5730423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1015256
End bp	1016341
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	41%
IMG OID	641285481
Product	ferredoxin-NADP oxidoreductase (FNR)
Protein accession	YP_001550998
Protein GI	159903654
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0369] Sulfite reductase, alpha subunit (flavoprotein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.93922
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTACT CGGAAGCAAA TGTAATCGCC GGTGGCCTGG CGCATATACC TGTTCTCATT 
GGGGTATTTG GCTTTATTCA GTCATTTATT CTCAAGCGAA CCCAAGCAAA AGGCACATCC 
AATCAGCCCA GTACTCAGAC GAAGCCAGCC TCATCAGTGG CTTCTTCACA GCCAAAAGTA 
ATTAAAAAGC CAGCCCATCC AAATGTTCCC GTTAATACCT ATAAACCAAA GACCCCTTTT 
ATTGGGACTG TTAAAGAGAA CTACTCACTA TTGAAATCAG GTGCAATTGG TAGGGTTAAT 
CACATAACCT TTGATCTATC TAGTGGAGAC CCTCTTCTTA AATACGTAGA AGGTCAAAGC 
ATTGGAATAA TTCCTGCTGG CGAAGATGCT AATGGTAAAC CTCACAAAAT TCGGCTCTAT 
TCAATAGCCA GTACAAGACA TGGTGATGAC TATAAAGGTA ATACAGTTTC TCTATGTGTC 
CGTCAACTTC AATATGAAAA AGATGGCAAA ACTATTGATG GAGTCTGTTC AACTTATCTG 
TGTGACATAA AGCCTGGAGA CAAGGTAAAA ATCACCGGAC CTGTTGGGAA AGAAATGCTT 
CTTCCTGAAG ACGAGAATGC CAACATAATT ATGCTCGCCA CAGGTACAGG CATAGCCCCT 
ATGAGAGCCT ATCTTCGAAG AATGTTTGAT CCAACAGAAC AAGAAAAAAA CAGCTGGAAC 
TACAAAGGGA ATGCATGGCT GTTCATGGGT GCTCCAAAAA CTGCAAACCT TCTTTATGAC 
TCTGATTTTG AAGGCTACAA GTCTAAATTC CCTAACAACC TACGTTATAC AAAAGCAATT 
AGCAGGGAAC AAAAGAATGC CAGAGGTGGT CGCATGTACA TTCAAGATCG GGTACTTGAA 
CACGCTGATG AGATATTTGC ATTGATTGAG AATCCAAAAA CTCATATTTA TCTTTGTGGT 
TTAAAAGGAA TGGAACCTGG CATAGATGAA GCAATGACTC AAGCAGCAGC TTCAAAAGGC 
TTGGTTTGGT CAGAATTAAG GCCTCAACTT AAGAAAGCAG GCAGATGGCA CGTTGAGACG 
TATTAA

Protein sequence

MSYSEANVIA GGLAHIPVLI GVFGFIQSFI LKRTQAKGTS NQPSTQTKPA SSVASSQPKV 
IKKPAHPNVP VNTYKPKTPF IGTVKENYSL LKSGAIGRVN HITFDLSSGD PLLKYVEGQS 
IGIIPAGEDA NGKPHKIRLY SIASTRHGDD YKGNTVSLCV RQLQYEKDGK TIDGVCSTYL 
CDIKPGDKVK ITGPVGKEML LPEDENANII MLATGTGIAP MRAYLRRMFD PTEQEKNSWN 
YKGNAWLFMG APKTANLLYD SDFEGYKSKF PNNLRYTKAI SREQKNARGG RMYIQDRVLE 
HADEIFALIE NPKTHIYLCG LKGMEPGIDE AMTQAAASKG LVWSELRPQL KKAGRWHVET 
Y