Gene HY04AAS1_1126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_1126
Symbol
ID	6743942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	+
Start bp	1042686
End bp	1043717
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	35%
IMG OID	642750935
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002121790
Protein GI	195953500
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATA TAATAGCTAA TATAAAGAAG TCTTACATTA TAGGAGCAGT GATCCTATTA 
GTTGTGATTG GTGGCTTTTT TGTTTATGAA CATGAATATG GTCCAGAAGC AAAATACCAA 
AAAGGTCTTC ATTATTATAA AGATAAAAAC TACCAAAAAG CATTACCTTT ATTTAAAGAA 
TCAGCAAAGC AGGGGTATGC ACCAGCAGAA GCTAAACTTG GGTATATGTA TTTACGTGGT 
TTAGGAGTGT CAAGAGATGA CGATAAGGCT GCTTATTGGT TTAAAAAAGC TGCACACCAA 
GGTAATGCTA GAGGAGAAGT TGGTCTTGGT TATATGTATT TGTTTGGCAA AGGCGGAGTA 
TCAAAAGATT ATCAAAAAGC TTTATATTGG ATTAAGAAAG CAGTTAAACA AGGTGATGCT 
CGAGGAGAAA ATAACCTTGG ATATATGTAT GAATATGGTT TAGGAGTACC ACAGGATTAT 
AGCAAAGCTG TATATTGGTA TAAAAAAGCT GCTGAACAAG GACTTGCAGC AGCAGAAGAT 
AGTCTTGGAT ATATGTATGA ATATGGTTTA GGAGTACCAC AGGATTATAG CAAAGCTGTA 
TATTGGTATA AAAAAGCTGC TGAACAAGGA CTTGCAGCAG CAGAAGATAA TCTTGGATAT 
ATGTATTTGT TTGGCAAAGG CGGAGTATCA AAAGATTATC AAAAAGCTTT ATATTGGATT 
AAGAAAGCTG CACATCAAGG TGATGCTTTA GGAGAAGCTA CTCTTGGACA TATGTATGCA 
GAAGGTTTAG GAGTACCACA GGATTATAGC AAAGCTTTAT ATTGGTTTAA AAAAGCTGCT 
AAACAAGGAC TTGCACAAGC AGAAAATAAT CTTGGATATA TGTATGCAGA AGGTTTAGGA 
GTACCACAGG ATTACAACGA AGCCGTATAT TGGTTACAGA AAGCTGCTGA ACAAGGACTT 
GCACAAGCTA AAATCAACCT TGAATATATA AAAACAAAAC TTGCATTAAT GCACCTATTT 
GGTGGTTATT GA

Protein sequence

MNNIIANIKK SYIIGAVILL VVIGGFFVYE HEYGPEAKYQ KGLHYYKDKN YQKALPLFKE 
SAKQGYAPAE AKLGYMYLRG LGVSRDDDKA AYWFKKAAHQ GNARGEVGLG YMYLFGKGGV 
SKDYQKALYW IKKAVKQGDA RGENNLGYMY EYGLGVPQDY SKAVYWYKKA AEQGLAAAED 
SLGYMYEYGL GVPQDYSKAV YWYKKAAEQG LAAAEDNLGY MYLFGKGGVS KDYQKALYWI 
KKAAHQGDAL GEATLGHMYA EGLGVPQDYS KALYWFKKAA KQGLAQAENN LGYMYAEGLG 
VPQDYNEAVY WLQKAAEQGL AQAKINLEYI KTKLALMHLF GGY