Gene P9303_04491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_04491
Symbol
ID	4777411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	451586
End bp	452806
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	55%
IMG OID	640085953
Product	aldo/keto reductase family protein
Protein accession	YP_001016466
Protein GI	124022159
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGT CTTTGGAGCA GAGCTCTCTG CCTTGCCGCC GCTTTGGCCG CACCGGTTTA 
TCAATGCCTG TGTTGTCTTT AGGGGGGATG CGCTTTCAGC AGAGCTGGAC AGATTTGGAG 
GCGGAGGTCA TTACCTCTGA GTCGCAGCAA CTGCTGCAGG ACATTTTGGA GCGAGCGGTG 
GCCTGTGGCT TCCATCATGT GGAGACGGCA CGCCATTACG GCAGCTCTGA GCGGCAGTTG 
GGATGGGCGC TGCGTGATGT CTTGGATCCA GAGCGGCTGT TGCAGAGCAA AGTTCCTCCT 
CGTGAGGATC CCAAAGTCTT TGAGGCTGAG TTGGCACTCA GCTTTGAACG ATTGGGATGT 
GAACGATTGG ATCTAGTTGC CATCCATGGC CTCAACCTTT CGGAGCATCT GGAGCAGACC 
TTGCGACCAG GAGGTTGCAT GGATGTGTTG CGTCGTTGGC AGGGTGATGG ACGCATCGGC 
CATGTGGGTT TTTCCACCCA TGGCCCCACA GACCTAATCG TGCAGGCGAT CGAGACGGAT 
GCCTTTGATT ATGTGAACCT GCACTGGTAT TTCATTTATC AAGACAATGA TCCTGCACTG 
GATGCAGCTG CTCGTCATGA CCTAGGCGTT TTCATCATTA GCCCGACAGA TAAGGGTGGC 
CATCTGCATA GTCCCTCGTC TCAACTTCTG GAACTCTGCG CTCCACTTCA TCCAATTGTG 
TTCAACGATC TGTTCTGCTT GCAAGACCCA AGGGTTCATA CGATCAGCGT TGGCGCAGCG 
CGACCCAGTG ATCTCGATCG GCATCTCGAG GCGGTGGATC TCTTGCAGAG TGCCGCTGAG 
TTGCTGCCAC CAGTTCAGCA GCGACTCGTT GATGCGGCAC AGTTGGCTTT AGGTGAGGCT 
TGGTTGACCA GTTGGCATAG GGGCTTGCCG CCCTGGCAGG AGTCTCCAGG CGAGATCAAT 
CTTCCGATCT TGCTTTGGCT TCATAATCTT GTAGAGGCTT GGGGAATGGA GGGTTATGCA 
AAAGCCCGCT ACGGCTTACT TGGCAGTGGC AGCCACTGGT TCCCTGGAGC GAATGCCGAA 
GCACTGGATG CAGATGTGAG TGAGGCGGCC CTCAGGGAGG TGTTGGTGAA CAGCCCCTGG 
TGTGATCAGA TCCCAGGCTT GCTGCGTAGG TTGCGCAACC GTCTTGGTGG TCATCCTCAG 
CAACGACTGA CCAGTGTTTA A

Protein sequence

MKASLEQSSL PCRRFGRTGL SMPVLSLGGM RFQQSWTDLE AEVITSESQQ LLQDILERAV 
ACGFHHVETA RHYGSSERQL GWALRDVLDP ERLLQSKVPP REDPKVFEAE LALSFERLGC 
ERLDLVAIHG LNLSEHLEQT LRPGGCMDVL RRWQGDGRIG HVGFSTHGPT DLIVQAIETD 
AFDYVNLHWY FIYQDNDPAL DAAARHDLGV FIISPTDKGG HLHSPSSQLL ELCAPLHPIV 
FNDLFCLQDP RVHTISVGAA RPSDLDRHLE AVDLLQSAAE LLPPVQQRLV DAAQLALGEA 
WLTSWHRGLP PWQESPGEIN LPILLWLHNL VEAWGMEGYA KARYGLLGSG SHWFPGANAE 
ALDADVSEAA LREVLVNSPW CDQIPGLLRR LRNRLGGHPQ QRLTSV