Gene HY04AAS1_0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_0407
Symbol
ID	6743201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	-
Start bp	353528
End bp	354538
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	34%
IMG OID	642750200
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_002121075
Protein GI	195952785
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTT ACAAAGAAGC AGGTGTTGAT ATAGAAAAAG CAGATCGTTT TGTAGGCTTT 
TTAAAAGAAA GACTTAACAA TCTTAACAAA AACCTAAAAC AAGCATTACC CTTTGGGGCT 
TTTGCGGCAG GTTTTTTGGT AGAAGATTGC GATTTGGTAA TTACATCCAC CACAGACGGG 
GTTGGCACAA AGCTAAAAAT AGCCCAAAAC GTAAATATAC ACAACACAGT AGGCATAGAC 
TTAGTAGCAA TGAACGTAAA CGATATAATT ACCACTGGCT CAAAGCCAAT AGCATTTTTA 
GATTATATAG CCATAGGCAT GATTGAAGGG TCTACAATAA ACCCGCTGAT AGAAGGCATT 
ATAACAGGTT GCGAAGAAGC AAATACACCT CTTGTGGGTG GAGAAACTGC GGAAATGCCT 
TCTTTCTACA AAGACGGTGA ATACGATTTA GCTGGTTTTT GCATAGGTAT TTGTAAAAAA 
GATGAGATTG TTACAGGGCA AGATGTAAAA GAGAATGATA TTATAATTGC TATACCATCT 
TCTGGATTTC ACAGCAACGG TTTTTCCCTT GTAAGATATA TATTAGAAAA GCACAATATT 
AAATACAATG ATTATATAAA AGAGTTTGGA AAAGAACTTT GGGAAATATT ACTAACACCT 
ACAAGGATAT ACGTAAAAGA TGTTTTGGAG CTTAAAAACA AAATAAAGAT AAAAGCTATG 
GCTCATATAA CAGGCGGTGG AATACCGGGA AACATAACGA GGGTTATACC ATATGGTTTA 
AGAGCCGTGA TATCAGCTTA TCCGGTACCG GATTTATTTT TATGGTTTCA AAAGCTTGGA 
AACATAAAAA AAGAAGAAAT GTACAAAACT TTTAATATGG GAGTAGGGTT TATGATTATT 
ATCGAAGAAA AAGATAAAGA GGTTGCTTTG AACACTATAA AAGATTCTTT TGTTGTAGGG 
TATATAGAAC AATCAAAAGA TAATAGCAAA ATTGTTTTAA ATGACATATA G

Protein sequence

MSTYKEAGVD IEKADRFVGF LKERLNNLNK NLKQALPFGA FAAGFLVEDC DLVITSTTDG 
VGTKLKIAQN VNIHNTVGID LVAMNVNDII TTGSKPIAFL DYIAIGMIEG STINPLIEGI 
ITGCEEANTP LVGGETAEMP SFYKDGEYDL AGFCIGICKK DEIVTGQDVK ENDIIIAIPS 
SGFHSNGFSL VRYILEKHNI KYNDYIKEFG KELWEILLTP TRIYVKDVLE LKNKIKIKAM 
AHITGGGIPG NITRVIPYGL RAVISAYPVP DLFLWFQKLG NIKKEEMYKT FNMGVGFMII 
IEEKDKEVAL NTIKDSFVVG YIEQSKDNSK IVLNDI