Gene BURPS668_1297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1297
Symbol	nuoH
ID	4881817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1267706
End bp	1268770
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	63%
IMG OID	640127225
Product	NADH dehydrogenase subunit H
Protein accession	YP_001058345
Protein GI	126441743
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTGT TCGATACGAT CAACTCGGGC GGAGCCCAGC TTCTCGGCGT CGCATGGCCG 
ACGGTGTGGG CGCTCGTGCG CATCCTCGTC GTCGCCGTCG TGATCCTGCT GTGCGTCGCG 
TACCTGATTC TGTGGGAGCG CAAGCTGATC GGCTGGATGC ACGTGCGTCT CGGTCCGAAC 
CGCGTCGGCC CGGCGGGCCT GCTGCAGCCG ATCGCCGACG TGCTGAAGCT GCTGCTCAAG 
GAAGTGATTC GTCCGACGGC CGCGAGCCGC TGGCTGTATC TGGTCGCGCC CGTGATGACG 
GTGGTGCCGG CGTTCGCGGT GTGGGCGGTG ATCCCGTTCC AGGCGGGCGC GGTGCTCGCG 
AACATCAACG CCGGCCTGCT GTACGCGATG GCGATTTCGT CGATCGGCGT CTACGCGGTG 
ATTCTCGCCG GCTGGGCGTC GAACTCGAAG TACGCGTTTC TCGGCGCGAT GCGCGCGGCC 
GCGCAGATGG TGTCGTATGA AATCTCGATG GGCTTCGCGC TCGTGCTCGT GCTGATGACG 
GCGGGCAGCC TGAACCTGTC GGAGATCGTC GGCTCGCAGC AGCACGGCTT CTTCGCGGGC 
CACGGCGTCA ATTTCCTGTC GTGGAACTGG CTGCCGCTGC TGCCCGTGTT CGTCATCTAC 
TTCATCTCGG GCATCGCCGA AACGAACCGC CACCCGTTCG ACGTGGTGGA AGGGGAATCG 
GAAATCGTCG CGGGTCACAT GATCGACTAC TCGGGGATGG CGTTCGCGCT GTTCTTCCTC 
GCCGAGTACA TCAACATGAT CGTGATCTCG GCGCTCGCGG CGACGCTGTT CCTCGGCGGC 
TGGGACGCGC CGTTCGAATT CCTGTCGTTC ATTCCGGGCA TCTTCTGGCT GGTGCTGAAA 
ATCTTCGCGC TGCTGTCGGT GTTCATTTGG GCCCGTGCGA CGTTCCCGCG TTACCGCTAC 
GACCAGATCA TGCGCCTCGG CTGGAAGGTG TTCCTGCCCG TGTGCGTGTT CTGGGTGATC 
GTGGTCGGTT TCTGGATGAT GTCGCCGCTG AATATCTGGA AATAA

Protein sequence

MSLFDTINSG GAQLLGVAWP TVWALVRILV VAVVILLCVA YLILWERKLI GWMHVRLGPN 
RVGPAGLLQP IADVLKLLLK EVIRPTAASR WLYLVAPVMT VVPAFAVWAV IPFQAGAVLA 
NINAGLLYAM AISSIGVYAV ILAGWASNSK YAFLGAMRAA AQMVSYEISM GFALVLVLMT 
AGSLNLSEIV GSQQHGFFAG HGVNFLSWNW LPLLPVFVIY FISGIAETNR HPFDVVEGES 
EIVAGHMIDY SGMAFALFFL AEYINMIVIS ALAATLFLGG WDAPFEFLSF IPGIFWLVLK 
IFALLSVFIW ARATFPRYRY DQIMRLGWKV FLPVCVFWVI VVGFWMMSPL NIWK