Gene A9601_01781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_01781
Symbol	ndhA
ID	4716862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	164936
End bp	166054
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	36%
IMG OID	640077877
Product	NADH dehydrogenase subunit H
Protein accession	YP_001008573
Protein GI	123967715
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.236332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAATACG GATTAGATCT CGAATATAGT TTTAATGAAT TTTTAAAAGG CTTTGGCCTT 
TCCAGCGAAA TCGCCCATAT AATTTGGCTC CCTCTGCCAA TGCTTTTGGT TTTGGTAGCG 
GCAGTAGTTG GTGTTTTAGT AACAGTTTGG CTTGAAAGAA AAATATCTGC TGCTGCTCAG 
CAAAGAATAG GTCCTGAATA TGCAGGAGCA CTTGGCGTAC TCCAACCAAT TGCAGATGGG 
CTTAAGTTAC TTGTTAAAGA GGATATTATT CCTGCTAAAG CGGATGGAAT TCTCTTTACT 
GCAGGACCTA TATTAGTACT TGTCCCAGTG ATTCTATCCT GGTTAATTGT TCCTTTTGGA 
CAAAATCTTT TAATAAGTAA TGTTGGTATT GGAATTTTCC TATGGATTGC TTTAAGCAGT 
ATCCAGCCAA TAGGACTTCT CATGAGCGGA TATGCATCAA ATAATAAGTA TTCTTTATTA 
GGAGGTTTAA GAGCAGCAGC TCAATCAATT AGTTATGAAA TTCCTCTAGC TTTATCTGTA 
CTAGCTATTG TACTAATGAC AAATTCTCTA AGTACTATTG ACATTGTCAA CCAACAAAGT 
GGTGCTGGAA TCTTAAGTTG GAATATATGG AGACAACCAG TTGGTTTTAT AGTCTTTTGG 
ATTTGTGCTC TTGCAGAATG TGAGAGACTT CCATTTGACT TACCCGAAGC TGAAGAAGAA 
TTAGTTGCAG GATATCAAAC TGAATATGCA GGGATGAAAT TCGCATTGTT CTACCTAGGT 
AGTTACATTA ATCTAATCCT TTCAGCTTTA TTGGTATCAA TACTTTATTT GGGAGGATGG 
GGTTTTCCTG TTCCAGTTGA ATTAATAGCT AAGTTTCTAA ACTTGCCCAT TAATGCACCC 
TTTTTACAAG TGTTCACTGC ATCAATAGGA ATTGTAATGA CTGTATTGAA AGCATATCTT 
TTAGTTTTCA TTGCAATATT ATTGCGTTGG ACAACTCCTA GAGTAAGAAT AGATCAACTA 
TTAGACCTTG GATGGAAGTT TCTTCTTCCA ATTTCTCTTG CTAATCTTTT GATAACTGCA 
GGATTAAAAC TTGCTTTTCC GCAATTCTTT GGTGGTTAA

Protein sequence

MEYGLDLEYS FNEFLKGFGL SSEIAHIIWL PLPMLLVLVA AVVGVLVTVW LERKISAAAQ 
QRIGPEYAGA LGVLQPIADG LKLLVKEDII PAKADGILFT AGPILVLVPV ILSWLIVPFG 
QNLLISNVGI GIFLWIALSS IQPIGLLMSG YASNNKYSLL GGLRAAAQSI SYEIPLALSV 
LAIVLMTNSL STIDIVNQQS GAGILSWNIW RQPVGFIVFW ICALAECERL PFDLPEAEEE 
LVAGYQTEYA GMKFALFYLG SYINLILSAL LVSILYLGGW GFPVPVELIA KFLNLPINAP 
FLQVFTASIG IVMTVLKAYL LVFIAILLRW TTPRVRIDQL LDLGWKFLLP ISLANLLITA 
GLKLAFPQFF GG