Gene P9303_28831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_28831
Symbol
ID	4778957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	2549409
End bp	2551256
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	55%
IMG OID	640088406
Product	flavodoxin:flavin reductase-like domain-containing protein
Protein accession	YP_001018878
Protein GI	124024571
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0426] Uncharacterized flavoproteins [COG1853] Conserved protein/domain typically associated with flavoprotein oxygenases, DIM6/NTAB family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATAT CCTCCATCCA CGAGCCTGCA GCAGCAGCGC AGCGAACGGT GATCACACTC 
CCAATCGAAA AGGGCCTGAT CAGCTTGCGC GGCCTTAGTC CACAACGTCT GCGCTTTGAG 
CTGGAATATG CCCTGGAGCG AGGCAGTACC GCCAATAGCT TTCTTTTCTC TGCCGGTGAC 
GACTCACATG GGCAACCTCA ATCGGCTGTC CTCGTACACC CCCCTGGCGA CGCCTATGCC 
GAGGTTTTCA TGCCGGCACT CGCCAAGGCT CTACCTTCAG ATACCACAAC GTTGAAGGTG 
GTCGTTGGTC ACATCAACCC CAACCGAGTT GCGCTACTCA AAAAGCTGGC CAACAGCTAC 
CCCAAGCTGG AGTTAATCAG TTCCAATCCC GGCGCCAAAT TGCTCAAAGA GCTTTGGGAA 
CAACGCAAAC CAGCAACACC CAACAACAAT GAACAGGAAG AGTCATCCCT TCCGTCTCTT 
CCATCCATTG AGATTGTTCG ACAAGAACAG AAGCTCTCCC TCAGCAACGA ACACGCATTG 
TGGCTGCTAC CAGCGCCAAC AGCTCGCTGG CCAGGCGGCC TACTGGCCTT CGAGGAAAGC 
CTTGGCTTGT TGATGAGCGA CAAACTATTC GCCGCCCACC TCTGCACAAG CGAATGGGCA 
GAAGCCAATC GCATCAGCAC AGAAGAGGAG CGTAGGCATT TCTATGACTG CCTGATGGCT 
CCCATGGCCA GCCAGGTAGA TACCTTAGTA GAGCGGCTTG AAGAGCTAGA CATCCGCACG 
ATCGCCCCAT GCCATGGGCC AGCCATAGAA ACGAGCTGGC GGAGCCTGCT GAATGACTAC 
CGCCGCTGGG GTGAAAGCCA ACAACAAGCC CCTTTAAAGG TCGTTCTTCT TTTCGCCAGC 
GCCTACGGCA ACACAGCGGC GATTGCTGAC GCACTCGCAA AAGGAGTCTC CAGTACTGGT 
ATTCAAGTAG AAAGCCTCAA CTGCGAATTC ACACCTGCGA ATGAATTGGT AAATGCAATC 
CAACAAGCTG ATGCCTACTT GATTGGATCG CCAACCCTTG GAGGGCATGC ACCAACCCCA 
ATCGTATCGG CCCTAGGAAC CTTGCTGGCC GAAGGTGACC GCAACAAAAA GGTAGGCATA 
TTCGGCAGCT ATGGCTGGAG TGGAGAGGCA TTGGAACTTC TCGAAAAGAA GCTCCGTGAT 
GGTGGGTTCT CCTTTGGATT CGAGCCAATC AAAGTGAAGT TCAGTCCCGA TGCTGCCATG 
GTGAAAACCC TGGAAGAAAC AGGCACACTC TTTGGCCGAA AACTCCTCAA GCAACAACAA 
CGCGAGCAAC CACGAGCAAG CAGTGGCATG AGTGCAAGCC GTAGTGATCC AGCCGTGCTT 
GCCCTTGGTC GGGTAGTGGG CTCACTATGC ATCTTGACGG CTCGTAAAGG TGAAGGGAAT 
ACAGCGCTTA GCGGCGCAAT GGTCGCAAGC TGGGTCAGCC AAGCCAGCTT TTCACCGCCA 
GGGCTGAGCG TGGCCGTCGC CAAAGACCGA GCCGTTGAAG CGTTGCTGCA TCGGGGCGAC 
CACTTCGCTC TCAATGTGTT GGCAGCAGGA AGGCAACACG AACTGATGAA ACATTTCCTG 
CAACCATTCC CAGCTGGTTC AGACCGGTTC GCAGGGCTAG ACCTTGACGC CAGTCCCGCA 
GGTCAACCGC TGCTTAAAAA TGCGCTGGCA TGGCTTGAAG GATGCGTACA GCAACGCATG 
GAATGTGGAG ACCACTGGCT GCTATATGCC GAGATCAGCC ATGGTGCCCT ACTGGAGCGA 
GAAGGCACGA CGGCTGTGCA TCAGCGCCGC AGCGGGGCGA ACTACTGA

Protein sequence

MSISSIHEPA AAAQRTVITL PIEKGLISLR GLSPQRLRFE LEYALERGST ANSFLFSAGD 
DSHGQPQSAV LVHPPGDAYA EVFMPALAKA LPSDTTTLKV VVGHINPNRV ALLKKLANSY 
PKLELISSNP GAKLLKELWE QRKPATPNNN EQEESSLPSL PSIEIVRQEQ KLSLSNEHAL 
WLLPAPTARW PGGLLAFEES LGLLMSDKLF AAHLCTSEWA EANRISTEEE RRHFYDCLMA 
PMASQVDTLV ERLEELDIRT IAPCHGPAIE TSWRSLLNDY RRWGESQQQA PLKVVLLFAS 
AYGNTAAIAD ALAKGVSSTG IQVESLNCEF TPANELVNAI QQADAYLIGS PTLGGHAPTP 
IVSALGTLLA EGDRNKKVGI FGSYGWSGEA LELLEKKLRD GGFSFGFEPI KVKFSPDAAM 
VKTLEETGTL FGRKLLKQQQ REQPRASSGM SASRSDPAVL ALGRVVGSLC ILTARKGEGN 
TALSGAMVAS WVSQASFSPP GLSVAVAKDR AVEALLHRGD HFALNVLAAG RQHELMKHFL 
QPFPAGSDRF AGLDLDASPA GQPLLKNALA WLEGCVQQRM ECGDHWLLYA EISHGALLER 
EGTTAVHQRR SGANY