Gene HY04AAS1_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_0810
Symbol
ID	6743616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	-
Start bp	751822
End bp	752916
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	36%
IMG OID	642750611
Product	Radical SAM domain protein
Protein accession	YP_002121475
Protein GI	195953185
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0537641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAGC TTTTAGAGGA TAAAGAAGTA TCTTTTCTTT TGGAAAAAGC CTTAAACAAA 
GAAAGATTGA CAGAGGAAGA GGCTGTTTTT TTATATAAAA ATGCTCCGTT AAGCGCTTTA 
GGGTATATAG CAAACGAGTT AAACAAAGAA AAAAATCAAG ACAGAGCTTT TTTTATAGTA 
AACAGATATT TAAACCCTAC AAACATATGT GTATACAAAT GCAAATTTTG TAGCTTTGGT 
GTTTCAAAGT CAGACGAAAG AGCTTTTGAA CTTAGCATAG GCGAGGTGTT AAGAAAAATA 
GAAAACTCTT ACAAAAACGG TATAACAGAG GTACACATAG TTGGCGGATT GCCACCGCAT 
TGGGAAAGAG AAGATTACGT AAACCTAATA AAAGTTGTCA AAGAAAACTT TCCAAACATA 
GTCATAAAAG CTTATACAGC GGTGGAAATA GACCACATAG CAAAAATATC AAAATCTACT 
TACGAAGATG TGCTCCTTGA ATTAAAAGAA GTTGGCTTGT CTTTATTGCC AGGAGGCGGT 
GCTGAAATAT TTGCCGATAG GGTGAGAAAC ATAATAGCAC CAAACAAAGC CAACGCGGAA 
GAATACCTTG AAATACATGA AACTGCCCAT AGACTAGGTA TACCATCAAA CGTTACGATG 
CTTTATGGAC ATATAGAAAC CATAGAAGAA AGAGTAGATC ATATGAAAAG AATAAGAGAT 
TTGCAGGGCA AAACCGGAGG TTTTCAAGTA TTTATACCTT TAGCTTATCA TCCAAAAGGG 
ACATCTCTCG GTGGCGAGAG GACATCTTCT GTGGATGATC TTAAAACCAT AGCGATGTCA 
AGGATTTTTC TAGATAACTT CGATAACATA AAAGCATATT GGATAACCTT AGGAGAAAAG 
TTAGCTCAGA TAGCTCTAAA TTTTGGCGCA AACGATATAG ATGGAACTTT AGAAGAAGAA 
CTCGTTGTGC ATGCGGCTGG TTCTACAGAA ACTTACGGTA AAACGGTAGA CAAGCTTGTA 
AGCATTATAA AAGGAGCTTC CAAGATTCCT GTACAAAGAG ACTCCTTTTA TAATATAATA 
AAAGTTTATA ATTGA

Protein sequence

MIELLEDKEV SFLLEKALNK ERLTEEEAVF LYKNAPLSAL GYIANELNKE KNQDRAFFIV 
NRYLNPTNIC VYKCKFCSFG VSKSDERAFE LSIGEVLRKI ENSYKNGITE VHIVGGLPPH 
WEREDYVNLI KVVKENFPNI VIKAYTAVEI DHIAKISKST YEDVLLELKE VGLSLLPGGG 
AEIFADRVRN IIAPNKANAE EYLEIHETAH RLGIPSNVTM LYGHIETIEE RVDHMKRIRD 
LQGKTGGFQV FIPLAYHPKG TSLGGERTSS VDDLKTIAMS RIFLDNFDNI KAYWITLGEK 
LAQIALNFGA NDIDGTLEEE LVVHAAGSTE TYGKTVDKLV SIIKGASKIP VQRDSFYNII 
KVYN