Gene P9301_00461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_00461
Symbol
ID	4912066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	47319
End bp	49094
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	34%
IMG OID	640159610
Product	flavoprotein
Protein accession	YP_001090270
Protein GI	126695384
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0426] Uncharacterized flavoproteins [COG1853] Conserved protein/domain typically associated with flavoprotein oxygenases, DIM6/NTAB family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.551818
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAGCCT CTGCCCAGAC AAGTAATTCC AAATTGGCAC AAATAAATAA CAAGTTGACA 
GTTCAATCTC AAAACTTTGC TGATGATTCT TGTGCCATAA GATCACTGGA TTGGGATCGC 
AGTAGATTTG ATATTGAATT TGGCTTAAGA AATGGCACTA CCTACAATAG TTTTATTATT 
AAAGGCGAAA AACTAGCAAT AATTGATACT AGTCACGCAA AATTCGAAGA ATTATGGTTT 
GAAGAATTAC TTAAAGAGGT AAATCCACAA GAAGTGGATT ATCTAATTAC AAGCCATACA 
GAACCTGATC ATTCTGGTTT AATAGGTAAT CTTTTACAAT TAAACAAAAA TATCACAGTA 
GTAGGATCAA AATTAGCCCT TAAGTTTATT GAAGACCAAA TACATGTTCC CTTTAAGCGA 
CTAGAAGTTA AAAGTGGAGA GTTTTTAAAT CTTGGAACTA ATCCTAATAG TGGCTTAGAA 
CATAATATTG AATTTATAAG CGCACCAAAT TTACATTGGC CCGATACAAT TTTTTCATAT 
GACCACAGCA CTCATGTTCT CTACACATGC GATGCATTTG GACTCCATTA TTGTTCTGAT 
GAATTTTATG ACACTGATCA AAAAGAAATA TATGATGATT TTCGTTTTTA TTACGATTGC 
CTAATGGGTC CAAACGCTAG AAGCGTTCTC CAAGCAATTA AAAGAATAGA TAAACTACCT 
GAATTAAAAA CAATAGCTGT AGGTCATGGG CCTTTGCTTC ATAATCAAGT TAATTTTTGG 
AAAGGGAAAT ATCAAGAATG GAGTAGCAAT AAAAGCAAAG GTAATGATTT TGTATCAGTT 
TGCTATATCA GCGACTATGG TTATTGTGAT CGACTAAGTC AAGCGATATC TCATGGAATA 
AGTAAAGCAG ATGCACAGGT TCAATTAATT GATTTAAGAT CTTCTGACCC CCAAGAATTA 
ACAAGTTTAA TTTCAGAGTC AAAAGCAGTA GTCATCCCCA CATGGCCAGT AGATTCAGAT 
AATGAATTAA AAGAATCTCT TGGTACTTTA TTTGCAGCAC TAAAATCAAA ACAATTTACA 
GCTGTCTATG ATGCATTTGG TGGAAATGAT GAACCAATAG ATTCCTTAGC AAATAAATTA 
AGAGAACTTG GTCAAAAAGA AGCTTTCTCT CCTTTAAGAG TAAAAAACAT TCCAGATCCC 
ATTGTTTATC AACAATTCGA AGAAGCTGGA ACTGACTTAG GACAATTGAT CAATAAAAAG 
AAAAATATTG CCTCTATGAA GAGCCTTGAT TCAAATTTAG ATAAAGCTTT AGGTAGGTTA 
AGTGGAGGAT TATATGTAGT TACAGCAAGC CAGGGAGAAG GTTCGACATT TAGACAAAGT 
GCGATGGTAG CAAGTTGGGT TAGTCAAGCA AGTTTTTCTC CACCAGGCAT TACAGTTGCA 
GTAGCAAAAG ATAGAGCTAT TGAATCATAT ATGCAAGTTG GCAAAGGTTT TGTTGTGAAT 
GTCTTGAGAG AAGATAATTA TCAAAAAATG TTCAGACATT TTTTAAAAAG ATTTGCTCCT 
GGAGCTGATA GATTTGCAGA TGTAGATATA ATTAGCAACA TCGCAGATGG AGGACCAGTC 
CTCTCAGATT CACTCGCTTT TTTAGATTGT AAAGTTAGTT CCAGACTGGA AACTCCAGAC 
CATTGGATAA TTTACGGAAT TGTTGAAAAT GGTAATGTCT CTGACTTATC ATGCAAGACA 
GCAGTTCATC ACAGAAAAGT TGCTAATCAC TATTAG

Protein sequence

MLASAQTSNS KLAQINNKLT VQSQNFADDS CAIRSLDWDR SRFDIEFGLR NGTTYNSFII 
KGEKLAIIDT SHAKFEELWF EELLKEVNPQ EVDYLITSHT EPDHSGLIGN LLQLNKNITV 
VGSKLALKFI EDQIHVPFKR LEVKSGEFLN LGTNPNSGLE HNIEFISAPN LHWPDTIFSY 
DHSTHVLYTC DAFGLHYCSD EFYDTDQKEI YDDFRFYYDC LMGPNARSVL QAIKRIDKLP 
ELKTIAVGHG PLLHNQVNFW KGKYQEWSSN KSKGNDFVSV CYISDYGYCD RLSQAISHGI 
SKADAQVQLI DLRSSDPQEL TSLISESKAV VIPTWPVDSD NELKESLGTL FAALKSKQFT 
AVYDAFGGND EPIDSLANKL RELGQKEAFS PLRVKNIPDP IVYQQFEEAG TDLGQLINKK 
KNIASMKSLD SNLDKALGRL SGGLYVVTAS QGEGSTFRQS AMVASWVSQA SFSPPGITVA 
VAKDRAIESY MQVGKGFVVN VLREDNYQKM FRHFLKRFAP GADRFADVDI ISNIADGGPV 
LSDSLAFLDC KVSSRLETPD HWIIYGIVEN GNVSDLSCKT AVHHRKVANH Y