Gene HY04AAS1_1081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_1081
Symbol
ID	6743896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	-
Start bp	1005773
End bp	1007089
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	38%
IMG OID	642750889
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_002121745
Protein GI	195953455
COG category	[C] Energy production and conversion
COG ID	[COG2048] Heterodisulfide reductase, subunit B
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.87184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTAC TTAGATATGA CAAGACCAAA TTTCCAATTC AAAACAACCA TGCTCATTAC 
GATGAAATAT TTGAGCGCAT GGAAGAATTG GAAGCAAAGG GCGAGATCCT TATACATAGA 
ATCACCGAAG AACATAAACC TGTAGAGGTT TATACAAGAA CAGGTCGTAT AAAGACTGTG 
CCTACCAACA AACTATGGCA TCATAAATCT TGTGGACAAT GTGGTAATAT ACCCGGTTAT 
CCAGCATCTA TATTCTGGTT TATGAACAAG TTTGGATATG ATTATCTAAA TGAACCACAC 
CAAACTTCTT GTACCGCATG GAACTATCAC GGTTCTGGTA CGTCAAATCC AGTGGCTTTG 
GCAGCTGTAT GGCTAAGAAA CATGCACCAA GCTTGGAAGA CTGGTTATTA TCCTTTAATT 
CACTGTGGTA CTTCATTTGG TTCTTACAAG GAAACTAGAG AACAACTCAT AATGAATAAA 
GAACTTAGAG ATGCTGTAAG ACCTATATTG AAGAAGTTGG GTAGATTAGG ACCAAATGGT 
GAATTGGTGA TACCTCAAGA GGTAGTACAT TATTCAGAAT GGACACATGC AAACAGATAT 
AAAATAAAAG AATTATACGA AAAAGAAGGT AAACCAAGAG GTATAGATGT GTCAAATGTA 
AGAGTTGCTA TACACAACGC TTGCCACGTT TGGAAAATGA TAGCTGACGA TTACGTATAT 
GACCCAGAAA TATATGGAGG CCAAAGACCA GCAGCATCTA CGGCTGTTAT AAAAGAATTG 
GGAGCTATAG TTGCTGACTA TTACACATGG TATGATTGCT GTGGTTTTGG ATTTAGGCAT 
ATATTGACAG AAAGAGAGTT TACTAGGTCT TTTGCTATAA ATAGAAAGTT GAAGGTAATA 
TATGAGGATG CTAAGGCAGA CCTCATCGTA ACTCACGATA CTGGTTGTAC CACAACTTTC 
GAAAAGAATC AATGGATAGG CAAAGCTCAT GATATGTACT ATCCGGTAGC TGTTATGTCA 
GATGTTATGT TCTCAGCTTT AGCCTGCGGT GCACATCCGT ACAAGATAGT CCAGCTGTAC 
TGGAACTGCT CAAGTTATGA ACCTCTTTTG GAAAAAATGG GTATAACCAA CTGGAAAGAG 
CTAAAAAAAG AGTGGGAAGA CACCGTAAAA TATATAAATG AGCTTGATAA AGCAGGCAAA 
CACGACGAAC TTCAAGAATT CTTTAAAACC TATGACTTGT ATGAACCATA CAGCAGAACA 
TCCGACGGCA AACCAAGAGC AAGTGCAACG GCTGATAAGG TATTGTTTAG ATCTTAA

Protein sequence

MSLLRYDKTK FPIQNNHAHY DEIFERMEEL EAKGEILIHR ITEEHKPVEV YTRTGRIKTV 
PTNKLWHHKS CGQCGNIPGY PASIFWFMNK FGYDYLNEPH QTSCTAWNYH GSGTSNPVAL 
AAVWLRNMHQ AWKTGYYPLI HCGTSFGSYK ETREQLIMNK ELRDAVRPIL KKLGRLGPNG 
ELVIPQEVVH YSEWTHANRY KIKELYEKEG KPRGIDVSNV RVAIHNACHV WKMIADDYVY 
DPEIYGGQRP AASTAVIKEL GAIVADYYTW YDCCGFGFRH ILTEREFTRS FAINRKLKVI 
YEDAKADLIV THDTGCTTTF EKNQWIGKAH DMYYPVAVMS DVMFSALACG AHPYKIVQLY 
WNCSSYEPLL EKMGITNWKE LKKEWEDTVK YINELDKAGK HDELQEFFKT YDLYEPYSRT 
SDGKPRASAT ADKVLFRS