Gene P9303_20971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_20971
Symbol	mqo
ID	4776834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1857664
End bp	1859154
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	52%
IMG OID	640087605
Product	malate:quinone oxidoreductase
Protein accession	YP_001018097
Protein GI	124023790
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID	[TIGR01320] malate:quinone-oxidoreductase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGTCT CTGATGTTGC TGGATCCCAA TCTCGCTACG ACGCGGTGCT TGTCGGGGCT 
GGAATTATGA GTGCCACTTT GGCGGCCCTG CTGCATGAGC TCGATCCTGA GCTGCGTTTG 
TTGATGGTCG AGCGTTTGCA GGCGCCGGGT CTTGAGAGCA GTGCGGCTGA AAACAATGCA 
GGCACTGGTC ATGCGGCTAA TTGCGAACTG AATTACACAC CGCTTCAGCC TGATGGCAGC 
GTGGCTACGG CTAAGGCTTT GGCCATTAAT ACCGCCTTTG AGCGCTCTTT GGAGTTCTGG 
GCTTCGTTGA CGGAAAAAGG CAAGTTGCTA CCGCAGCAAT TTCTACATCT GGTCCCTCAT 
ATCAGTGTGG TTTTTGGCGA TGCTGATTTG GCTTTCTTGC ATCAGCGCTT TCAGCAATTG 
AGTGCGCTAC CTGCCTTTGC CTCCATGCAA TGGAGTACTG ATGCCGCTGA GCTTGCCGAA 
TGGATGCCAT TGGTGATGGA AGGGCGAGCC AATGCAGAAT CTGTTGCTGC AACCTGCATT 
AAGCGGGGTA CGGATGTGGA TTTCGGATTG CTGACAAGGG CCTATGTGAA GTCATTGCAA 
GCAAGCGGAG CTTTGGAATT GAGTTGCGGC TGCGAAGTCG TTCATTTGCA CCGGCTCGGC 
AAGCACCGGT GGAATCTTGA TCTCAAGCAC TCTTCTGGAA GTCGCTCTGT GCAGACACCT 
TTTGTGTTTC TCGGTGCAGG AGGGGGGGCA TTGCCTTTGT TGCAGCGATC TGGCATTCCA 
GAGGCAGCTG CCTATGCAGG CTTTCCAGTG AGCGGACAGT GGTTGGTCTG CTCTGAGCCA 
GGTTTAACGG CAAGGCATCA CGCCAAGGTG TATGGCAAGG CGAAGGTGGG TGCTCCTCCA 
ATGTCTGTGC CACATCTTGA TAGCCGTTGG ATTGATGGAT GCCGCTCGTT GCTTTTCGGG 
CCTTATGCGG GTTTCAGTAG CAAATTCCTC AAGCAAGGCT CCCGCTTGGA TCTCTTGCGT 
TCGGTACGGC GCAGCAATTT TCGCTCCATG TTGGAGGTGG GTTTTAAAAA CTTTGATTTA 
GTCACTTATC TCCTCTCAGA GCTACAGCAG AGTGAGAAAG ATCGCTTTGA AACCCTAAAG 
CAATTTCTTC CCAATGCGCA GTTGAATGAT TGGAAGCTTT CAGTTGCTGG CCAGAGAGTA 
CAAATCATCA AAGGCACAGC CGAGGGGGGG CGTTTGCAGA TGGGTACAGA GGTGGTATCC 
GCTGAAGATG GCTCCCTAGC TGCCTTATTA GGAGCTTCGC CTGGGGCTAG TACAGCGGTG 
ACGGTCATGC TGGAAGTTTT GCAGCGTTGC TGGAGCGAGC GTATGGCAAG TGAATCTTGG 
CAAGAACGAT TGCAAAAACT GTTGCCGAGT TATGGCCATG ATCCTAATTC TGATCCCTTA 
CTGCTGATGC AGATGCGCAT ACGCAGCAAT GAATTACTCA GTTTTACTTG A

Protein sequence

MAVSDVAGSQ SRYDAVLVGA GIMSATLAAL LHELDPELRL LMVERLQAPG LESSAAENNA 
GTGHAANCEL NYTPLQPDGS VATAKALAIN TAFERSLEFW ASLTEKGKLL PQQFLHLVPH 
ISVVFGDADL AFLHQRFQQL SALPAFASMQ WSTDAAELAE WMPLVMEGRA NAESVAATCI 
KRGTDVDFGL LTRAYVKSLQ ASGALELSCG CEVVHLHRLG KHRWNLDLKH SSGSRSVQTP 
FVFLGAGGGA LPLLQRSGIP EAAAYAGFPV SGQWLVCSEP GLTARHHAKV YGKAKVGAPP 
MSVPHLDSRW IDGCRSLLFG PYAGFSSKFL KQGSRLDLLR SVRRSNFRSM LEVGFKNFDL 
VTYLLSELQQ SEKDRFETLK QFLPNAQLND WKLSVAGQRV QIIKGTAEGG RLQMGTEVVS 
AEDGSLAALL GASPGASTAV TVMLEVLQRC WSERMASESW QERLQKLLPS YGHDPNSDPL 
LLMQMRIRSN ELLSFT