Gene Haur_3084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3084
Symbol
ID	5734956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3892898
End bp	3894166
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	52%
IMG OID	641280228
Product	NADH-quinone oxidoreductase, F subunit
Protein accession	YP_001545850
Protein GI	159899603
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAAGA CAGAACTCAA AGAATATATT GTGATGCGCA ATCGCGAAAT TGAAAATATT 
CGCGATCTTG ATGTGTATCT GGCAAGTGGT GGGTATGCGA TGGCCAAGCA AGCCTTGACC 
AGCATGACCC CAGCCGCAAT TATCGACGAA GTAAAAAAAT CGGGCTTGCG CGGTCGTGGC 
GGCGCTGGCT TCCCGACTGG GGTTAAATGG AGCTTCGTTC CCAAGGAATT AAACCCCAAA 
TATTTGGTGG TCAACGCCGA TGAGAGCGAG CCAGGCACGT TCAACAACCA TGAAATTATC 
GACGAAAATC CCCATCAATT GCTCGAAGGG ATTGTAATCA GTGCCTTTGC AATTGGCGCG 
AACGTCGCCT ATATCTACAT TCGCGGCGAA TTTGCCTATG GCGCACGTTT CCTTGAGCAA 
AAAATTGCTG AAGCTCGCGC CCGTGGCTTG ATCGGCAAGA ATTTGTTTGG CACTGGCTAC 
GATGTGGAAA TTTATGTCCA TCGTGGAGCT GGCGCTTACA TTTGTGGCGA AGAAACCGCC 
TTGCTCGAAT CGCTCGAAGG CAAAATCGGC CAGCCACGTT TGAAGCCACC CTTCCCTGCT 
GTCGCTGGTT TGTATGCCAA GCCAACCGTG GTCAACAACG TTGAAACCTT GACCAACGTG 
CCACGGATTA TCGAAAAAGG CGCTGATTGG TTCCGCTCGT TCGGCACCGA AAAATCGCCT 
GGCACCAAAG CAGTTTCAAT TAGCGGCCAC GTCAAAAAAC CTGGCAACTA TGAAATTCCC 
TTGGGCATCA CGATTCGCGA GTTCATTTTC GATTGGGCTG GCGGTATGCG CGACCCTAAT 
TTGCCATTGA AGTTCATTAT CCCAGGCGGT GCTTCATCCA ACTGGCTAAC CGAGCAACAC 
CTCGATTTGC CAATGACGTG GGATGATATG GCCGCTGCGG GAACGATGCT CGGCTCAGGC 
GCGATGGTCG TGCTCGATAC CTCGGTTCCA GTGGTGCGAG CAGCCTTGAA GGTTGACGAA 
TTCTTCAAAC ACGAATCGTG TGGCAAGTGT TCGCCCTGTC GCGAAGGCAC GCACTTCTTG 
GTCAAGGTGT GGGAGCGGAT CGACGAGGGC CACGGGCGGG TTGGCGATAT TGAATTATTG 
GCTGATGTTG GCAAGCAAAT GCTTGGCAAG TGTTTCTGCC CACTGGGCGA TTCATCAGTT 
TCAGCCGTCA ATAGCGCGAT CAAATTCTTC CGGCCTGAGC TTGATGCAGC GATCGATGCA 
CAACACTAA

Protein sequence

MPKTELKEYI VMRNREIENI RDLDVYLASG GYAMAKQALT SMTPAAIIDE VKKSGLRGRG 
GAGFPTGVKW SFVPKELNPK YLVVNADESE PGTFNNHEII DENPHQLLEG IVISAFAIGA 
NVAYIYIRGE FAYGARFLEQ KIAEARARGL IGKNLFGTGY DVEIYVHRGA GAYICGEETA 
LLESLEGKIG QPRLKPPFPA VAGLYAKPTV VNNVETLTNV PRIIEKGADW FRSFGTEKSP 
GTKAVSISGH VKKPGNYEIP LGITIREFIF DWAGGMRDPN LPLKFIIPGG ASSNWLTEQH 
LDLPMTWDDM AAAGTMLGSG AMVVLDTSVP VVRAALKVDE FFKHESCGKC SPCREGTHFL 
VKVWERIDEG HGRVGDIELL ADVGKQMLGK CFCPLGDSSV SAVNSAIKFF RPELDAAIDA 
QH