Gene A9601_04961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_04961
Symbol
ID	4717194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	431676
End bp	432773
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	31%
IMG OID	640078208
Product	aldo/keto reductase
Protein accession	YP_001008891
Protein GI	123968033
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.583752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCTAT TCACTTTAGG GACAATGCGA GGAACTGAAA GTCTTGAAAA AATGTATAGC 
ATAATAAAAA ATGCATATTA TGTAGGAATT AATCACATAG AAACAGCACC CTCTTATGGT 
GATGCTGAAT CACTTATTGG AAATTCAATA AAAAAATTAG CAATAGAAGA GAATATAAAA 
GAAAAAAATT GGGTAATTAC TTCCAAAGTT TTACCAAAGG GTGATTTTGA CTTTTTAAAA 
AATAATTTTA AAAAGTCTCT TAAAAATTTA AATCGCGAGA AAATTAATAA TCTTGCAATT 
CACGGACTCA ACTTAAAACA ACATCTAGAT TGGGCTCTTG TTGGAGAGGG TAAGAAATTC 
ATATCTTGGA TACTTGAAAA GGAACTAGTT GATCAAGTTG GTTTTAGTTC TCACGGAAGT 
TATTCACTAA TTAAAGATGC AATTAACTGT GAAGTTTTTA ATTTTTGTAG TCTTCACTTA 
CATTATTTAG ATCAATCTAA GATTTCTTTA GCGGAGGAAG CTATAAAAAA AGGTATGGGA 
GTTTTAGCAA TATCACCTGC TGATAAAGGT GGTAAATTGT ATTCTCCAAG TGATATTTTA 
ATAGAGGCCT CTAAGCCTTT TCATCCATTA GAATTAGCGT ATCGATTTCT GCTCGCAAAA 
GGCGTTACAA CTTTATCCTT GGGGGCGGCA AACAAAAAAG ATTTTGAATT TGCATATAAA 
CTTAGAAATT CATTCGATAA GCTTACAAAA CTTGAAAAAA GCGCCCTTAA TAAAATTGAG 
GAAGTTTCTA ATGAAAGATT AAACTCAACC AAATGTGAAC AATGTAGATC TTGTCTTCCA 
TGTCCAAATG AAGTGCCTAT TCCAGAAATA CTTCGTTTAA GAAATATATC TATTGGTTAT 
GGCCAAATAG AATTTTCAAA AGAAAGATAC AATTTAATAG GAAAAGCTGG CCACTGGTGG 
GAAGAAAAAA ATTCCTCATT TTGTCAAGAA TGTAATGAAT GTGTTCCTAA ATGTCCTAGT 
AAATTAGACA TACCAAATTT ATTAACGGAA GCCCATAACT TATTAACTGA AAATCCTACA 
AAAAGATTAT GGGGATAA

Protein sequence

MSLFTLGTMR GTESLEKMYS IIKNAYYVGI NHIETAPSYG DAESLIGNSI KKLAIEENIK 
EKNWVITSKV LPKGDFDFLK NNFKKSLKNL NREKINNLAI HGLNLKQHLD WALVGEGKKF 
ISWILEKELV DQVGFSSHGS YSLIKDAINC EVFNFCSLHL HYLDQSKISL AEEAIKKGMG 
VLAISPADKG GKLYSPSDIL IEASKPFHPL ELAYRFLLAK GVTTLSLGAA NKKDFEFAYK 
LRNSFDKLTK LEKSALNKIE EVSNERLNST KCEQCRSCLP CPNEVPIPEI LRLRNISIGY 
GQIEFSKERY NLIGKAGHWW EEKNSSFCQE CNECVPKCPS KLDIPNLLTE AHNLLTENPT 
KRLWG