Gene Hlac_0862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0862
Symbol
ID	7400828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	853107
End bp	854138
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	71%
IMG OID	643707927
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_002565530
Protein GI	222479293
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.454531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGG GCGACGGCGG CGAGACGGGC GGCGGCGACG AGGAACCGAC GATCGACGGC 
GACGACGAAC TCACCTACGC GGACGCCGGC GTCGACATCG ACGCCAGCGA GGCGGCGACC 
GCGGCGCTGA TCGGCGCGGT CGGCGAGGGG GAGGGCGACT ACGCCGGCCT GCTCGACATC 
GGCGACCGCT ACCTCGCGCT GGCGACCGAC GGGGTCGGGA CGAAGCTGCT CGTCGCCGAG 
GCGCTTAGCG ACTACTCGAC GGTGGGGATC GACTGCATCG CGATGAACGT CAACGACCTC 
GTTGCCGCCG GGGTGCGCCC CGTCGCGTTC GTCGACTACC TCGCCGTCGA CGAGCCGGAC 
GAGCGGTTCG CCGAGCAGGT CGGCGAGGGG CTCGCGCGCG GCGCCGAACT CGCCGACATG 
GAGCTCGTCG GCGGCGAGAC CGCGGTGATG CCCGACGTGA TCCGCGGGCT CGATCTGGCG 
GGGACCTGCG CCGGACTCGC CGCGAAGGAG GCCGTCTTCG ACGGCGCGGC GGAGCCGGGC 
GACGCACTCG TCGGCTGGCG TTCCTCCGGG ATCCACTCGA ACGGGCTCAC GCTCGCCCGG 
GAGGCCGCGA CCCGCGAGCA CGCGTACACC GACCCGTGTC CGTTCGACGG GTACGAGACG 
GTCGGCGAGG CGCTGTTAGA GCCGACCCGG ATCTACACCG ATCTGCTCGA CCCGATGCGC 
GACCACGGCG TGCGCGGCGC GGCTCACGTT ACCGGCGGCG GCTGGACCAA CCTGACGCGG 
CTCGGCGCGA ATCGGTACGT CGTCGACGAC GCCTTCGAGC CGCAGCCCGT CTTCGAGTTC 
GTGCAGTCGG AGGGGAGCGT CTCTGACGAG GAAATGCACC GGACGTTCAA CATGGGGACC 
GGCTTCGTCG CCGCCGTCGA CCCCGACGCG GCCGAATCGC TGGCTGCCGA GACGGATGGG 
CGTGTGATCG GGCGAGTAGA GGAGGGCGAT GATGATGAGG GGAGCGTCGC GATCCGCGGA 
CTGGAGTTAT AA

Protein sequence

MTEGDGGETG GGDEEPTIDG DDELTYADAG VDIDASEAAT AALIGAVGEG EGDYAGLLDI 
GDRYLALATD GVGTKLLVAE ALSDYSTVGI DCIAMNVNDL VAAGVRPVAF VDYLAVDEPD 
ERFAEQVGEG LARGAELADM ELVGGETAVM PDVIRGLDLA GTCAGLAAKE AVFDGAAEPG 
DALVGWRSSG IHSNGLTLAR EAATREHAYT DPCPFDGYET VGEALLEPTR IYTDLLDPMR 
DHGVRGAAHV TGGGWTNLTR LGANRYVVDD AFEPQPVFEF VQSEGSVSDE EMHRTFNMGT 
GFVAAVDPDA AESLAAETDG RVIGRVEEGD DDEGSVAIRG LEL