Gene Msed_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1984
Symbol
ID	5103371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1919175
End bp	1920146
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	51%
IMG OID	640507872
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001192048
Protein GI	146304732
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0608348
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAGTG AGTACAAGGA TGCCGGGGTT GACCTAAATA AGTTGAAGGA GATACACAGG 
GATATAGCTT CCGCGATCTC CTCAACGTAC AGGAGAACTG TGCTGGGGGC AGGGCACTAC 
TCTGGTGTTG TGGAGATAAA CGGGTTGAAA CTCGCAATTC ACGTGGATGG GGTTGGCACC 
AAGGTTATCC TTGCCAAAAG GGCCAGAAAA TATCGGAGCG TCGGGATAGA TTGTGTTGCC 
ATGAACGTGA ACGATCTCAT TAGCATAGGT GCTAAGCCCA TTGCCCTAGT GGACTACATT 
GCCATGGACC AGCCATCCGA AGAGGTGATA TCAGAGATAG TCCAGGGACT GGTGCAGGGA 
GCCAAGGAGT CTGACACTGA GATAGTGGGA GGAGAGACGG CAGCGATGAA GGATGTGGTG 
AACGGCTTCG ATCTGTCCTG TACCGCGCTG GGCGTTGTGG ATAAACTGAA GACTGGGGAA 
GAGGTTTCTC CCGGGGACGT GATTATTGGG CTAGCTAGTA ACGGAGTTCA CGCCAATGGC 
TACTCCTTGG TCAGGAAGCT CCTTGATGAG GGGAAGCTAT CGTGGAAGGA TTGGGAGGAG 
GAGCTCCTGA AACCCACCAG GATCTACGTT AAGCCTGTCC TCGAGGTTCT GGAACTCATC 
AAGGCAGCTG GACACATCAC GGGGGGTTCC TTCAGTAAGC TCAGGAGGAT AACCAACTAC 
TCACTGGAGT TGACCCTCCC AGATCCACCC CTGATCTTCA AGACCATTGA ACAAGCTGGT 
ATTTCGCACG AGGAAATGCA CAGGGTCTTC AACATGGGTA TTGGCATGGT AGTCTTTGTG 
GATAGAACCA ACGCCGAGGA TGTTCTTAGG AAATTAAACC CCTATGTCCC ATCACAGATT 
ATTGGCGAGG TTAAGGACAA CGTTGGTCAG ATCAAAATTA CCACGTATAA GTCCCAGGTT 
CTTTATTTAT AG

Protein sequence

MVSEYKDAGV DLNKLKEIHR DIASAISSTY RRTVLGAGHY SGVVEINGLK LAIHVDGVGT 
KVILAKRARK YRSVGIDCVA MNVNDLISIG AKPIALVDYI AMDQPSEEVI SEIVQGLVQG 
AKESDTEIVG GETAAMKDVV NGFDLSCTAL GVVDKLKTGE EVSPGDVIIG LASNGVHANG 
YSLVRKLLDE GKLSWKDWEE ELLKPTRIYV KPVLEVLELI KAAGHITGGS FSKLRRITNY 
SLELTLPDPP LIFKTIEQAG ISHEEMHRVF NMGIGMVVFV DRTNAEDVLR KLNPYVPSQI 
IGEVKDNVGQ IKITTYKSQV LYL