Gene P9211_04381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_04381
Symbol
ID	5731208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	414197
End bp	415333
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	41%
IMG OID	641284795
Product	aldo/keto reductase
Protein accession	YP_001550323
Protein GI	159902979
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG TTCGAAGACC TTTTGGAAAA GAAGTGGAAG TCAGCCTGTT CACATTAGGG 
ACCATGAGAG CCCTTGAGTC TTCTGAAGCA ATGTATGCGG TAGTTAAAGA GGCTTGCTTG 
GCTGGGATCA ATCACATAGA AACTTCTCCT TCATATGGAC CTGCTCAAAA GTTCCTAGGC 
GAATCTTTAC AAAAACTTAG ATTTCATAAA ATCAATCCTC AGAATGGCTG GGTAGTCACA 
AGCAAGATCC TTCCAGGCAT TACCTTCTCA GAAGGCCAAA GGCAACTACA GCAAACTTTA 
GTAGACATTG GGATTCCAAA GATTGACAAT CTTGCAGTTC ATGGTCTTAA TCTTCCTGAA 
CATTTAACAT GGGCCCTACA TGGAGACGGG ATTAAACTGA TTCAGTGGGC TAAAGAAAAA 
AATCTTATTG CCCAGTTCGG GTTTACCTCT CATGGTGATC AATCCCTTAT AGAGAAAGCT 
ATAAAAAGTC GCCAATTTAA TTTTTGTAGT CTACATTTAC ATCTTCTCGA CCAAGGTAGG 
CTCCATCTTA GCAAACTTGC TTTGAATCAA GACATGGGGG TAATGGCTAT TTCACCAGCA 
GACAAAGGTG GTCACTTGCA TACTCCAAGT CAAACCTTAA TTAAAGATTG CTCTCCAATA 
TCTCCTATCG AATTGGCATA TAGATTTCTA TTAGCTCAAG GGGTCAGTAC ATTAACACTA 
GGAGCCAATA AGCCAGAAGA GCTCTCTATA GCTAAAAAGC TAGTAGCAGC AAATGGGCAA 
TTAACCAAAG CAGAGGAAGC CTCTATGAAT CGTCTATATC AAGAGGGGAA GCGTCGGCTA 
GGGGATACTT TATGTGGGCA ATGTCGAGAA TGTATCCCAT GTCCAAACAA TGTTCCAATA 
CCTGAGATAT TGCGATTGCG AAACTTATCT ATCGGACATG ATCTAACTTC CTTCTCAAAA 
GAAAGATATA ACCTCATAGG GAAAGCAGGG CATTGGTGGG AAGAGGTTGA TGCTAGTGCT 
TGCAAGAAGT GTGGGGATTG TCTACCACGT TGTCCAAATC ATCTAAAAAT ACCGGACTTA 
CTTGAACAAA CACATCATCA CTTATTAGAT AGACCTAAAA GAAGATTATG GGGTTGA

Protein sequence

MKIVRRPFGK EVEVSLFTLG TMRALESSEA MYAVVKEACL AGINHIETSP SYGPAQKFLG 
ESLQKLRFHK INPQNGWVVT SKILPGITFS EGQRQLQQTL VDIGIPKIDN LAVHGLNLPE 
HLTWALHGDG IKLIQWAKEK NLIAQFGFTS HGDQSLIEKA IKSRQFNFCS LHLHLLDQGR 
LHLSKLALNQ DMGVMAISPA DKGGHLHTPS QTLIKDCSPI SPIELAYRFL LAQGVSTLTL 
GANKPEELSI AKKLVAANGQ LTKAEEASMN RLYQEGKRRL GDTLCGQCRE CIPCPNNVPI 
PEILRLRNLS IGHDLTSFSK ERYNLIGKAG HWWEEVDASA CKKCGDCLPR CPNHLKIPDL 
LEQTHHHLLD RPKRRLWG