Gene Htur_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1119
Symbol
ID	8741707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	1165995
End bp	1167158
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	69%
IMG OID	646511698
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_003402684
Protein GI	284164405
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGC TACGGACGCC GGGACCGACG CTCGGGGTCG TCGGCGGCGG ACAGCTCGGA 
CGGATGCTCG CAGAGGCGGC GTCGCCGCTG GGAGTCGAGG TCGTCGTGCT CGATCCGACG 
CCGGACTGTC CGGCCGCGCC GGTCGCCCGC GACCAGATCG TCGCCGACTT CGACGACGAG 
GCGGGGATCC GCGAACTCGC CGCGCGCGCG GACGTGCTCA CCTTCGAGAT CGAACTCGCC 
GATCAGGACG TCTTAGAGCG CATCAGCGAG GACACGGGGA CGCCGGTCCA TCCGAAGCCG 
TCGACGCTGC GGACGATCCA CGACAAACTC GTCCAGAAGC GCGAACTCGA GGACGCGGGC 
GTTCCGGTGC CGCCGTTCCG CGAAGTCGAG GACGCCGACG ACATCCGCGC GGCCATCGAC 
GACTACGGCG CGCCGGTAAT GTTGAAGGCC CGAACGGGCG GCTACGACGG CCGCGGCAAC 
GTCCCCGTCG AGTCGAAAGC CGAAGCCGAC GAGGCCCTCG AGTCGGTCGC CGGCCCCGCG 
ATGGTCGAGT CGTTCGTCGA CTTCGAGCGC GAGGTCTCGG TGATCGCCGT CAAAGGCGAT 
GACGAGGTCG CGACCTTCCC GCTGGGCGAG AACGTCCACG TCGACGAGAT CCTCCGGGAA 
ACCATCGTTC CCGCGCGCTC GAGCGACGCG GCCGCGGAAC GCGCCTACGA CGTCGCGCGG 
GACGTCCTCG AGGTGATGGA CGGCCGCGGC GTCTACGGCA TCGAACTGTT CGAAACGCCC 
GACGAGGAGA TCCTGCTCAA CGAGATCGCG CCGCGCCCGC ACAACTCCGG CCACTGGACG 
ATCGAGGGCG CGGCGAATTC GCAGTTCGAA CAGCACGCCC GCGCCGTGCT GGGCTGGCCG 
CTGGGCTCGA CGGACCTGCG CTCGCCGACC GTCCTGACGA ACCTGCTCGG CGACGTCGAC 
GAGGAGCAGC GCGCGGAACT GGGCGATATC GACCGCCTTC TCGAGACACC CGGCGCGAAC 
CTCCACTGGT ACGGCAAGCG TCAGGTCCGG CCGCTGCGCA AGATGGGTCA CGTGACGGTC 
TCGGCCGAAG ACGAGGACGC CGACGTCGAG GACCTGCTCG AGACGGCGCG CAAACTCGAG 
GACGCGGTAA CGTTCCGAAA CTGA

Protein sequence

MTTLRTPGPT LGVVGGGQLG RMLAEAASPL GVEVVVLDPT PDCPAAPVAR DQIVADFDDE 
AGIRELAARA DVLTFEIELA DQDVLERISE DTGTPVHPKP STLRTIHDKL VQKRELEDAG 
VPVPPFREVE DADDIRAAID DYGAPVMLKA RTGGYDGRGN VPVESKAEAD EALESVAGPA 
MVESFVDFER EVSVIAVKGD DEVATFPLGE NVHVDEILRE TIVPARSSDA AAERAYDVAR 
DVLEVMDGRG VYGIELFETP DEEILLNEIA PRPHNSGHWT IEGAANSQFE QHARAVLGWP 
LGSTDLRSPT VLTNLLGDVD EEQRAELGDI DRLLETPGAN LHWYGKRQVR PLRKMGHVTV 
SAEDEDADVE DLLETARKLE DAVTFRN