Gene Haur_4989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4989
Symbol
ID	5736825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6325261
End bp	6326958
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	51%
IMG OID	641282156
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_001547747
Protein GI	159901500
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAACG AATTTATCAA ATTCAGTGAT TGGAGCATCA CCACGCTAAT TGCCCTTTCG 
CCATTGGTGG GGATGTTGCT GGCCTTGGTA TTCCCCAAGC CAGCCGAAAA CAGCCGCACG 
ATTGCTTGGG GGGTGTTTGC GTGGAGCTTG GTGCCACTCG GACTCACGCT CTTCTTGTGG 
CTTAGCGGTG GGTTTAATCC AGCCCTCGCT TCTGTCGCTG GCGATCAAGC CATGATCCAG 
CAAGTGGATC GGGTGCGCTG GGTTCCATTT TTCAACGCTG ACTATTTTGT TGGCCTTGAT 
GGCCTGAACT TCCCGCTGGT GTTTTTGACC ACAGCGTTAA CGCCAGTCTG TATCTTGGCA 
GCCTTCCGCA TCAAACATCG CCAAAACGTC TATTTGGCCT TGATGTTGTT GTTGGAATCG 
GCGATGTTGG GCTATTTCGT ATCGCTCAAC TTCTTGCTGT TGTTCCTGTT CTGGGAATTC 
AGCTTGGTGC CAATGTTCTT TATTATCAAC AACTGGGGTG GTGAAAACCG CCGCTACGCT 
GCCTTCAAGT TCTTCGTGTA TACGATGGCT GGCTCGGTGG CGATGTTGTT GATTTTCGAA 
TTTATCTATT TGGCGACTGG TACCTTCGAT TTGGTGGTGC TCTCACGCTT GGGTCAGGGC 
TTGCCCGTTG ATCCAGCCTT GCTTGCGCCA AAATTGGGTG CAGGCTACAC CAGCGGCGCA 
ACCTTGCAAT CAATGTTGTT CAGCGCCGTC GAAGATATTG GCTTGACCAG CATTTTGGGT 
ACAAGCAATG GCACCCCAGC AGCAATTGTC TTCTGGAGTA TCTTTGTGGC CTTTGCGGTG 
AAATTGGCAG TTTGGCCGTT GCACACCTGG CAGCCCGACA CTTACGAAAA TGCCCCAACC 
AGTGGCTCGA TGATTGTCTC AGCCGTGATG TCGAAGATGG GTGCGTATGG CATGATCCGC 
ATTATGATTA TGCTCTTCCC CCAACAAACC AAATTCTTCG CACCAGCGTT AGCAATCTTG 
GCCTTGGCAA GCATTTTGTT TGGTGCCTAC GCTGGTTTGG CCCAAATCAA CCTTAAGCGT 
TTGATCGCCT ATGCTTCGAT TAACCACATG GGCTATGTTT TGCTTGGCTT GGCGGCAGTA 
GCTTCGGCAG CGCCCGAAAG CCTTGGCGAC TTAGCCGTGA ATATCCGCGC CTCAGCAATG 
AATGGGGTGC AAGCACAGAT GGTTGCCCAC GGTTTCAGCA CCGCCGCATT GTTCTTCCTC 
GCGGGTGAAC TCTACGAACG GACTGGCACG TACCAGCTTG ATCAATTTGG CGGCTTGCGT 
AAAGTTATGC CAATTTTTGC TGGGATTATG GGCGTGGCGA TGTTTGCCAA CCTTGGGTTA 
CCTGGTTTGG CTGGCTTCGT CGGCGAATTC TTTATTTTCC GTGGCGCGTG GGGCACGCAG 
CCAGTGATCA CCACAATTGC TGTGTTGGGC TTGATTGTGA CTGCCTTGGT GCTGATCCGA 
ATGTATCAAA AGATCTTCTA CGGGCCAGTT AACCACAAGC TGACCAACCT GCCAGACATC 
AAAGTTGGTG ATTGGGCCTT CAACGTAACC CTACCGTTGA TTATTGTACT GTTGGTGTTT 
GGGATTTTCC CCAAGCCACT GATGGATTTA TCAAACTACG CAGCCACGGT GATGGCTCAG 
GTGTTTACAA ACCTGTAA

Protein sequence

MLNEFIKFSD WSITTLIALS PLVGMLLALV FPKPAENSRT IAWGVFAWSL VPLGLTLFLW 
LSGGFNPALA SVAGDQAMIQ QVDRVRWVPF FNADYFVGLD GLNFPLVFLT TALTPVCILA 
AFRIKHRQNV YLALMLLLES AMLGYFVSLN FLLLFLFWEF SLVPMFFIIN NWGGENRRYA 
AFKFFVYTMA GSVAMLLIFE FIYLATGTFD LVVLSRLGQG LPVDPALLAP KLGAGYTSGA 
TLQSMLFSAV EDIGLTSILG TSNGTPAAIV FWSIFVAFAV KLAVWPLHTW QPDTYENAPT 
SGSMIVSAVM SKMGAYGMIR IMIMLFPQQT KFFAPALAIL ALASILFGAY AGLAQINLKR 
LIAYASINHM GYVLLGLAAV ASAAPESLGD LAVNIRASAM NGVQAQMVAH GFSTAALFFL 
AGELYERTGT YQLDQFGGLR KVMPIFAGIM GVAMFANLGL PGLAGFVGEF FIFRGAWGTQ 
PVITTIAVLG LIVTALVLIR MYQKIFYGPV NHKLTNLPDI KVGDWAFNVT LPLIIVLLVF 
GIFPKPLMDL SNYAATVMAQ VFTNL