Gene Htur_3445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3445
Symbol
ID	8744065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	3548911
End bp	3550071
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	66%
IMG OID	646514026
Product	arsenical-resistance protein
Protein accession	YP_003404980
Protein GI	284166701
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAACG CGACCCACGA CCACGGGCCG GACTGCAGCT GCGAGGCCTG TGGCGATCCG 
CGGTCGATGG ACTTCCTCGA CAAGTACCTG ACCGTCTGGA TCTTCGCCGC GATGGCCGTC 
GGCGTCGGCC TCGGCTACGC GGCGCCGTCC GTGACCGAAC CGATTCGGGA CCTCCACCTC 
GTGGAGATCG GGCTCGTCGC CATGATGTAC CCGCCGCTGG CGAAGGCGGA CTACGGGCGG 
CTTCCGACGG TGTTTCGCAA CTGGCGCGTG CTCAGCCTGA GCCTCGTCCA GAACTGGCTC 
ATCGGCCCGA CCCTGATGTT CGGGCTCGCG GTGTTCTTCT TCAGCGGACT CGTACCCGGC 
CTCCCGGCCC GTCCCGAGTA CTTCCTGGGA CTCGTGTTCA TCGGGATGGC CCGGTGTATC 
GCGATGGTGC TCGTCTGGAA CGAACTCGCG GAGGGATCGA CCGAGTACGT GACCGGACTG 
GTCGCGTTCA ACAGCCTCTT CCAGATCGTT ACCTACGGCG TCTACGTCTG GTTTTTCGCC 
CTGTTCTTGC CGCCGCTGCT GGGCATGGAG TCGCTCGCCG CCGAAATCAC GACGTTCAAC 
GTGACGCCCG AACAGGTGTT CTGGGCGATC GTCGTCTTCC TCGGCATCCC CTTCGCCGGG 
GGAATCCTCA CCCGATACGT CGGCACGCGA GCGAAGGGCG AGGCGTGGTA CGACGAGGAG 
TTCGTCCCGA CGATCGACCC GCTCACGCTG GTCGCCCTAC TGTTTACCGT CGTCGTGATG 
TTCGCCACGC AGGGCGAGAA CATCGTCGCC GCGCCCGCGG ACGTGTTGCT GATCGCCGTC 
CCGCTGACGA TCTACTTCGT CGTCATGTTC CTCGTGAGCT TCGGCATGGG CCGAGGCGTC 
GGCGCCGACT ACTCGACGAC GACGGCCATC GGCTTCACCG CGGCCTCGAA CAACTTCGAA 
CTCGCGATCG CTGTCGCGGT CGCCGTCTTC GGCGTCGGCT CCGGCGTCGC CTTCACGACC 
GTCGTCGGCC CGCTCATCGA GGTCCCCGTG TTGCTCGCGC TGGTCCACGT CGCGCTGTAC 
TTCCAGCGGA AACTGGACTG GGGCGGCCGC GACGCCGGCG AACCGACCGT ATCGACTCGA 
GAGACGCCCA CCGACGACTA A

Protein sequence

MRNATHDHGP DCSCEACGDP RSMDFLDKYL TVWIFAAMAV GVGLGYAAPS VTEPIRDLHL 
VEIGLVAMMY PPLAKADYGR LPTVFRNWRV LSLSLVQNWL IGPTLMFGLA VFFFSGLVPG 
LPARPEYFLG LVFIGMARCI AMVLVWNELA EGSTEYVTGL VAFNSLFQIV TYGVYVWFFA 
LFLPPLLGME SLAAEITTFN VTPEQVFWAI VVFLGIPFAG GILTRYVGTR AKGEAWYDEE 
FVPTIDPLTL VALLFTVVVM FATQGENIVA APADVLLIAV PLTIYFVVMF LVSFGMGRGV 
GADYSTTTAI GFTAASNNFE LAIAVAVAVF GVGSGVAFTT VVGPLIEVPV LLALVHVALY 
FQRKLDWGGR DAGEPTVSTR ETPTDD