Gene WD0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD0159
Symbol
ID	2737866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	-
Start bp	147586
End bp	148611
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	39%
IMG OID	637172387
Product	NADH dehydrogenase subunit H
Protein accession	NP_965977
Protein GI	42520062
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACAC TAGTTAATAT TTTATTTATT TTAGTACCGC TACTACTTTC AGTTGCATAT 
TTGACATACT TTGAGCGTAA GGTCCTTGCT GCAATTCAAC TAAGGCACGG CCCGAGTGTA 
GTTGGACCTT TTGGGCTATT GCAGCCATTT GCAGATGCTA TTAAGCTACT GATTAAAGAG 
CCGATAATAC CATTTAGAGC GAGCACCATA CTGTTCATTA TGGCTCCAAT GCTTACCTTT 
ATCTTGGCAT TAATTGCCTG GGCAGTTATA CCGTTTGGTG CTGAAGTAAT TGTAGAAAAT 
GGCCAGCAAG TAATTATTCC TAAGGTTATA GCAAATATTA ATGTTGGAGT GCTTTACGTG 
CTAGCTATAT CGTCGCTGGG AGTATACGGC GTGATTATTG CAGGCTGGTC AAGCAACTCC 
AATTATGCAT TCCTTGGCGC TATACGGTCG GCTGCTCAGA TGATTTCATA TGAAGTTTCA 
ATAGGCTTAA TAGTTGCTGC AGTCGTTATT ACCACTGGAA CATTAAATCT TGGAGAGATG 
GTGGTAGCGA AACACAATAT GCCATTTTGG GTTGATTTGC TACTAATGCC TATAGGAATA 
ATATTTTTTA TTTCTTTGCT TGCAGAAACT AATCGTCACC CATTTGATTT ACCAGAAGCT 
GAAGCAGAGC TTGTCTCTGG ATATAACGTT GAATATTCAT CCATGCCTTT TGCCCTCTTT 
TTTCTTGGAG AATATGCAAA TATGATTCTA GCAAGTGCTA TGATGACGAT ATTCTTTCTA 
GGAGGATGGT ATCCGCCGCT GGAGTTCAGT TTACTTTACA AAATTCCAGG TTTAATTTGG 
TTCGTTTTGA AAATAGTTAT ACTTTTGTTT ATATTTATTT GGATTAGAGC AACAATACCT 
CGTTATCGAT ATGATCAGCT AATGCGCCTT GGTTGGAAAG TATTTCTACC AATATCGGTG 
CTTTGGGTGA TACTCATTTC AGGGGTGTTG CTCTTTACTG GGAACTTGCC TGGATCCAAT 
GTTTAA

Protein sequence

MNTLVNILFI LVPLLLSVAY LTYFERKVLA AIQLRHGPSV VGPFGLLQPF ADAIKLLIKE 
PIIPFRASTI LFIMAPMLTF ILALIAWAVI PFGAEVIVEN GQQVIIPKVI ANINVGVLYV 
LAISSLGVYG VIIAGWSSNS NYAFLGAIRS AAQMISYEVS IGLIVAAVVI TTGTLNLGEM 
VVAKHNMPFW VDLLLMPIGI IFFISLLAET NRHPFDLPEA EAELVSGYNV EYSSMPFALF 
FLGEYANMIL ASAMMTIFFL GGWYPPLEFS LLYKIPGLIW FVLKIVILLF IFIWIRATIP 
RYRYDQLMRL GWKVFLPISV LWVILISGVL LFTGNLPGSN V