Gene A9601_01671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_01671
Symbol
ID	4716851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	156647
End bp	158251
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	35%
IMG OID	640077866
Product	NAD(P)H-quinone oxidoreductase subunit 4
Protein accession	YP_001008562
Protein GI	123967704
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGGGAA CTTTGGGCGC TGGATTGTCT AATTTTCCTT GGTTATCTGC TTCAATTTTA 
TTCCCAATTG GTAGTGCATT TGTGATACCT TTTTTTCCAG ATAAAGGGGA TGGCAAAGAG 
GTGAGATGGT TTGCATTGTC TATTGCATTA ATTACTTTTT TAATAACTGT AGGTTCATAC 
ATAAATGGCT TTGATATTAG TAATGAAAAT GTTCAACTTA AAGAAAATAT TAGTTGGCTC 
CCTGATTTAG GTCTTACTTG GTCTGTTGGC GCTGATGGTA TGTCTATGCC GTTAATATTA 
TTGACTAGTT TTATAACTGC TTTAGCAGTT CTTGCTGCAT GGCCAGTAAA GTTCAAACCA 
AAGTTATTTT TCTTTTTAAT ATTGGTTATG GATGGTGGGC AAATCGCTGT GTTTGCCGTA 
CAAGATATGC TTTTATTCTT TCTAACTTGG GAACTTGAGT TAATTCCTGT TTATTTATTA 
CTCGCTATAT GGGGTGGCAA AAATCGACAA TATGCTGCGA CAAAATTCAT TATCTATACA 
GCTGGTAGTT CTATCTTTAT TCTTCTTGCC GCGTTAGCAA TGGGTTTCTA TGGTACAGAA 
ATTCCTAACT TTGAGTTTTC TCACTTGGCA GCTCAAGATT TTAGTCAAAA ATTCCAAATT 
TTATGCTATG TAGGGCTTTT AATTGCATTT GGTGTGAAAC TTCCAATAGT ACCCCTGCAT 
ACTTGGCTTC CAGATGCTCA TGGAGAGGCT ACAGCTCCAG TTCATATGCT TCTAGCGGGA 
ATTTTATTAA AGATGGGAGG ATATGCTCTT TTAAGATTTA ATGCACAATT ATTACCCGTC 
GCTCATGCTC AATTTGCTCC ATTATTGATA GTTCTAGGGG TAGTCAATAT CATTTATGCT 
GCATTAACTT CTTTTGCTCA AAGAAATCTT AAAAGAAAAA TTGCATATAG TTCGATAAGT 
CATATGGGTT TCGTTCTTAT TGGAATAGGC AGTTTCAGTA GCCTTGGAAC AAGTGGAGCT 
ATGCTGCAAA TGGTTAGTCA TGGATTAATC GGTGCAAGTT TATTTTTTCT TGTTGGTGCT 
ACCTATGACA GAACAAAAAC TCTTAAACTT GATGAAATGA GTGGTGTAGG ACAAAAAATG 
AGAATCATGT TTGCCTTATG GACTGCTTGC TCATTGGCTT CTCTTGCTTT GCCTGGTATG 
AGCGGATTTG TTTCCGAATT GATGGTTTTT ACAGGATTTG TTACTGATGA AGTGTATACT 
CTTCCTTTTA GGGTAGTGAT GGCTTCTTTA GCAGCTATCG GTGTAATACT TACTCCTATT 
TATCTACTTT CAATGTTACG AGAAATTTTC TTTGGTAAAG AAAATCCTAA ATTAATAGAA 
GAACGAAAAC TCATAGATGC AGAGCCAAGG GAAGTTTATA TTATTGCCTG TTTACTTTTA 
CCGATTATTG GAATAGGTTT ATACCCAAGA TTAGTTACTG AAAGTTATAT TGCATCTATC 
AATAATTTAG TCGATAGAGA TTTAACTGCC ATTAAAAGTG CTGCTAAAGC AAATATTTTT 
TCAGGAACTA AAAAAAATGA TATCCTAAAA GCTCCAACAA TATAA

Protein sequence

MLGTLGAGLS NFPWLSASIL FPIGSAFVIP FFPDKGDGKE VRWFALSIAL ITFLITVGSY 
INGFDISNEN VQLKENISWL PDLGLTWSVG ADGMSMPLIL LTSFITALAV LAAWPVKFKP 
KLFFFLILVM DGGQIAVFAV QDMLLFFLTW ELELIPVYLL LAIWGGKNRQ YAATKFIIYT 
AGSSIFILLA ALAMGFYGTE IPNFEFSHLA AQDFSQKFQI LCYVGLLIAF GVKLPIVPLH 
TWLPDAHGEA TAPVHMLLAG ILLKMGGYAL LRFNAQLLPV AHAQFAPLLI VLGVVNIIYA 
ALTSFAQRNL KRKIAYSSIS HMGFVLIGIG SFSSLGTSGA MLQMVSHGLI GASLFFLVGA 
TYDRTKTLKL DEMSGVGQKM RIMFALWTAC SLASLALPGM SGFVSELMVF TGFVTDEVYT 
LPFRVVMASL AAIGVILTPI YLLSMLREIF FGKENPKLIE ERKLIDAEPR EVYIIACLLL 
PIIGIGLYPR LVTESYIASI NNLVDRDLTA IKSAAKANIF SGTKKNDILK APTI