Gene Hore_06330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_06330
Symbol
ID	7314538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	682455
End bp	684191
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	42%
IMG OID	643611063
Product	NADH dehydrogenase (ubiquinone) 75 kDa subunit
Protein accession	YP_002508385
Protein GI	220931477
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00021405
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATA AAGTAAATAT AACATTAGAT GGTAAAAGTT TAACTGTAGA TAAAGATAAA 
ACTATTCTGG AAGTAGCCCG GGAAGCCGGG ATTAAGATTC CTACCCTCTG TTACCTGGAA 
GAAATTAATG AAATTGGTAG CTGCAGGGTC TGTGTAGTGG AAGTGAATGG AAAAATACAG 
CCTGCCTGCG TTACTCCGGT AAGTGAAGGC CTGGAAATCA CAACAACTTC ACCCAGGATT 
CGTGAAGCCA GGAGGATATC CCTCGAGTTA ATAATTTCAG ACCATCCTAT GGAATGTTTG 
ACCTGTAGTC GGAATGGAAA TTGTGAACTC CAGAGACTGG CAGAGGACTT TGGAATAAGT 
GAGATAACTT ATGAGGGTGA ACAGTCACAT TTTGAACCTG ATCTTTCATC ACCTTCAATT 
GTCAGGGATC CCGATAAATG TATTTTATGC CGGCGTTGTG TTAGTGTCTG TGAACAGGTT 
CAGGGGGTTG CTGCCTTAAC TCCCAATGAA AGGGGATTTT CTACCATAAT TACCCCTGCC 
TTTGGTCAAA AACTGGGTGA AATAGCATGT GCTAACTGTG GTCAGTGTAT AAATGCGTGT 
CCAGTTGGAG CCCTTTCTGA AAAGGATGAC ACCGAAAAGG TCTGGGAAGC CCTGGCTAAT 
CCCGATAAAC ATGTAGTGGT CCAGACAGCA CCTGCTGTCA GGGTATCGAT TGGTGAAGTA 
TTTGGAATGA AACCCGGTAG TCTGGTAACA GGAAAACTGA TGGCTGGTTT AAGACGGCTT 
GGTTTTGATA AGGTTTTTGA TACCAACTTT ACTGCTGACT TGACCATAAT GGAAGAAGGT 
CATGAATTAA TTGAAAGACT GAAAAACAAT GAAAGGCTAC CGTTGATTAC TTCCTGTAGT 
CCGGGCTGGA TTAAGTTTAT TGAACACTTC TACCCAAGTT ACCTTGAGCA TATCTCAAGC 
TGTAAATCTC CTCAACAGAT GTTTGGGGCC CTTGCCAAAA CTTATTACCC TGAAAATAAT 
GGTATAGACC CGGAAGATGT ATTTGTAGTT TCGGTTATGC CCTGTACTGC TAAAAAATTC 
GAAATAACAA GACCCGGTAT GGATAGTAGT GGGTATCAGG ACGTAGATGT GGTTCTTACC 
ACAAGGGAGC TGGCAAAAAT GTTTAAACAG GCCGGGATTG ACTTTGTGAA TCTCCCTGAT 
GAAGAATATG ATAAACCCCT CGGTATTTCG ACTGGTGCCG GTACTATTTT TGGAACAACA 
GGTGGCGTTA TGGAAGCAGC CTTAAGAACT GCCTATGAGG TATTAACAGG GGAGGAATTA 
CCCGGTCTGG AATTTGAGGA TGTAAGGGGT TTAGAGGGGA TTAAGGAATG TGAAATTGAA 
ATTAACGGTC AGAAAATAAA AGTTGCCGTA GCTCATGGAC TTTCCAATGC TCATAAGGTA 
CTTCAAAATA TAGACGACTA TCATTTTATT GAAATTATGG CCTGCCCTGG TGGTTGTGTT 
GGTGGTGGTG GTCAGCCCTA TCCTACCAAT GAAGAAACTA TAAGATTAAG GGCCCAGGGC 
CTTTACCGGG ATGATAAGGA ACATCAGATC AGGAAATCCC ACGAAAATCC TGTTGTCAAA 
AAACTATATG AAGAATTTCT TGGCAAACCA TTGAGTCATA AGTCTCATGA ATTACTACAC 
ACCGGGTATG TTGTAAGATC AAAATACCCG GCCAATGTTG AATCTGATGC GGTTTAA

Protein sequence

MSDKVNITLD GKSLTVDKDK TILEVAREAG IKIPTLCYLE EINEIGSCRV CVVEVNGKIQ 
PACVTPVSEG LEITTTSPRI REARRISLEL IISDHPMECL TCSRNGNCEL QRLAEDFGIS 
EITYEGEQSH FEPDLSSPSI VRDPDKCILC RRCVSVCEQV QGVAALTPNE RGFSTIITPA 
FGQKLGEIAC ANCGQCINAC PVGALSEKDD TEKVWEALAN PDKHVVVQTA PAVRVSIGEV 
FGMKPGSLVT GKLMAGLRRL GFDKVFDTNF TADLTIMEEG HELIERLKNN ERLPLITSCS 
PGWIKFIEHF YPSYLEHISS CKSPQQMFGA LAKTYYPENN GIDPEDVFVV SVMPCTAKKF 
EITRPGMDSS GYQDVDVVLT TRELAKMFKQ AGIDFVNLPD EEYDKPLGIS TGAGTIFGTT 
GGVMEAALRT AYEVLTGEEL PGLEFEDVRG LEGIKECEIE INGQKIKVAV AHGLSNAHKV 
LQNIDDYHFI EIMACPGGCV GGGGQPYPTN EETIRLRAQG LYRDDKEHQI RKSHENPVVK 
KLYEEFLGKP LSHKSHELLH TGYVVRSKYP ANVESDAV