Gene Hhal_1762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1762
Symbol
ID	4709076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1936496
End bp	1937749
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	65%
IMG OID	639856231
Product	NADH dehydrogenase subunit D
Protein accession	YP_001003328
Protein GI	121998541
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAGT TCCAGAGCTA CACCCTGAAC TTCGGCCCGC AGCACCCGGC CGCCCACGGG 
GTGTTGCGCT TGGTGCTGGA GATGGAGGGG GAGGCGGTGC GCCGTGCCGA CCCCCACATC 
GGTTTGCTGC ACCGGGCCAC CGAAAAGCTG GCCGAGTCCA AGCCTTACAA CCAGTCCATC 
GGCTACATGG ACCGGCTCGA CTACGTCTCG ATGATGTGCA ACGAGCACGG CTACGTGCGC 
GCCATCGAGA AGCTTTTGGG GATCGAGCCG CCGCTGCGGG CGCAGTACAT CCGCACGATG 
ATGGACGAGG TCACCCGCAT CCTGAATCAC TTGATGTGGT TGGGCGGGCA CGGCCTCGAC 
GTCGGTGCCA TGACCGCGTT CCTGTACACC TTCCGCGAGC GGGAAGACCT CATGGATGTC 
TACGAGGCGG TCTCCGGCGC GCGGATGCAC GCGACCTACT ACCGGCCCGG CGGGGTGCAC 
CGGGATCTCC CGGATCAGAT GCCGAAGTAC GAGCCCTCGG CCTACCGCAG CGACAAAGAG 
CTGCGCGAGA TGAACCGCGC CCGGGAGGGT TCGGTGCTCG ACTTCCTGGA CGATTTTTGC 
GAGCGCTTCC CGGCCTGCGT GGATGAGTAC GAGACGCTGC TGACTGAGAA CCGGATCTGG 
AAGCAGCGGC TGGTGGACAT CTGCCCGGTC TCCGCCGAGC GCGCCGTGGA GCTCGGGTTC 
ACGGGTCCCC TGCTGCGCGG TTCCGGGGTG GCTTGGGACC TGCGCAAAAA GCAACCCTAC 
GCTGCCTACG ACCGGGTCGA TTTCGACATC CCGGTCGGCG TCAACGGCGA CTCCTACGAC 
CGCTACCTGG TGCGCGTCGA GGAGATGCGC CAGTCGGTGC GCATCATCAA GCAGTGCGTG 
GATTGGCTGC GAGCCAACCC GGGTCCGGTG CGTATCGACG ATCCCAAGGT CACGCCGCCG 
ACCCGGGAAG AGATGAAGGA CGACATGGAG TCCCTCATCC ATCACTTCAA GCTCTTTACC 
GAGGGGTACT GCACGCCCCC CGGCGAGGTG TACGCGGCGG TCGAGGCGCC GAAGGGCGAG 
TTCGGGGTCT ACTTGATCTC GGACGGTGCC AACAAGCCGT ACCGGCTCAA GGTTCGGCCG 
CCGTGCTATT ACCACTTGGC GGCTACCGAC GAGATGATTC GCGGCTACAT GTTGGCCGAT 
GTGGTGACCT TGATCGGCTC GCTGGATGTG GTCTTCGGGG AGGTGGACCG GTGA

Protein sequence

MAEFQSYTLN FGPQHPAAHG VLRLVLEMEG EAVRRADPHI GLLHRATEKL AESKPYNQSI 
GYMDRLDYVS MMCNEHGYVR AIEKLLGIEP PLRAQYIRTM MDEVTRILNH LMWLGGHGLD 
VGAMTAFLYT FREREDLMDV YEAVSGARMH ATYYRPGGVH RDLPDQMPKY EPSAYRSDKE 
LREMNRAREG SVLDFLDDFC ERFPACVDEY ETLLTENRIW KQRLVDICPV SAERAVELGF 
TGPLLRGSGV AWDLRKKQPY AAYDRVDFDI PVGVNGDSYD RYLVRVEEMR QSVRIIKQCV 
DWLRANPGPV RIDDPKVTPP TREEMKDDME SLIHHFKLFT EGYCTPPGEV YAAVEAPKGE 
FGVYLISDGA NKPYRLKVRP PCYYHLAATD EMIRGYMLAD VVTLIGSLDV VFGEVDR