Gene Pars_0646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0646
Symbol
ID	5055175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	574958
End bp	575989
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	56%
IMG OID	640468206
Product	NADH dehydrogenase subunit H
Protein accession	YP_001152889
Protein GI	145590887
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.411826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTGGT GGTCTATAGC TCTCTCTCCT CGTCTTTGGT TTTTCCTATT GATGTTCGCG 
CTGTCGGGGG GCGTCTTATT GACGGTAGTT TGGTTTGAGA GAAAGGCAGC TGCGAGGGTT 
CAAATGAGGG TTGGGCCGTA TCACGTGTCG CCATGGTCTG GGGGGTATCT GCAACTTCTG 
GCAGACGCCT TCAAGTTCAT TATAAGCGAG CCGATTGTGC CCCGCGGAGC GCACAAGGTG 
CTATTTGTCT GGGGCCCGCC GCTCTTTGTA ACGCTCGCCT TCGGCGCCTC GCTACTCCTC 
CCGCTGACTC CCGAACTTAG GCTTATAAAA GACCCCGCTC TTTTGCCCTA CGGCCTTATC 
TTTTCTCTTG TAGTTCTCCT CCTGGTGTCC ATATCTGTGG TCATCATAGG CTGGTCTGTG 
AATAACAAAT TTGCCTACGT AGGCGCGGCG CGCGAGGCCC TTCTGGTAGC CGCCTACGAG 
CTTCCTCTTA TACTCTCCTT CTTGGCCATG GCGGTGCTGT ACGGCACGTT GAACCCACTG 
GAGATTGTGA ACAAGCAGAG CTTGCTTGTG GGCGCCTTGT GGAACCCCCT CGCCTTCCTA 
GTCTTCATAA TTGCCACTGC CATGGCCACA GCTAGGTTCC CCTTCGAAAT CGCCGACTAC 
GAGGGAGACT TGGCGACAGG GCCTTACAGC GACTACGGTG GGATATTTCT CGTCCTATCC 
TTCGCCGGCG GCACCTACTA CGCCACCTTC TCCTACTCCT TCCTCGCATC TCTGCTCTTC 
CTCGGCGGGT GGGCCCTCCC AGGCTTTTCG GCAGGCCCCT GGCCCCAGGA TATTATAGGC 
AATTTGATAT TGGCAATATG GGTATATGTA AAGGTAGTCG CCCTCATGTT TTTCTTCGCC 
TTCCTGAGGG CAGCGATGCC CGTGCTGAGG CTTGACCACA CCCTAGCGCT CGGCTGGCGG 
GGTCTCTTGC TCCTAGGCAT GGCCGGAGTT GTGTGGTCCG TAGTACTGAG GCTTGTGGGG 
GTGGCGCCAT GA

Protein sequence

MDWWSIALSP RLWFFLLMFA LSGGVLLTVV WFERKAAARV QMRVGPYHVS PWSGGYLQLL 
ADAFKFIISE PIVPRGAHKV LFVWGPPLFV TLAFGASLLL PLTPELRLIK DPALLPYGLI 
FSLVVLLLVS ISVVIIGWSV NNKFAYVGAA REALLVAAYE LPLILSFLAM AVLYGTLNPL 
EIVNKQSLLV GALWNPLAFL VFIIATAMAT ARFPFEIADY EGDLATGPYS DYGGIFLVLS 
FAGGTYYATF SYSFLASLLF LGGWALPGFS AGPWPQDIIG NLILAIWVYV KVVALMFFFA 
FLRAAMPVLR LDHTLALGWR GLLLLGMAGV VWSVVLRLVG VAP