Gene Hlac_0661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0661
Symbol
ID	7401796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	676742
End bp	677920
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	70%
IMG OID	643707727
Product	arsenite-activated ATPase ArsA
Protein accession	YP_002565333
Protein GI	222479096
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.626504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.149059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGATA TCGACGTCGA GCCGGTGGAT CGCGTCGAGG AGCCGGAGAT CAACGAGACC 
GCTGACGCCG ACCCCGCAAG CGACGCTGAT CTCCCGACCG AAACGGACGC TGCCACGGAC 
CTCCCGGCGG GCGTCGACGC CCCGGACTAC GTCCTCTACG GCGGGAAGGG CGGCGTCGGG 
AAGACGACGA TGGCGGCCGC GACCGGACTC GCCTCGGCGG CGGGCGGGGT CAACACCTTG 
GTGGTCTCCA CCGATCCGGC CCACTCCCTC TCCGATACCT ACGAGACGGA GATCCCGGCG 
AAACCAGCGC GCATTCGCGA GGACATGCCG CTGTACGCCG CCGAGATCGA CCCCGACGAC 
GCGATGGAGG AGGGGATGTT CGGCGCCGAC GGCGACCCCC TCGGCGGGAT GGGCGAGATG 
GGGGACGCGA TGGGCGGAAT GATGGGCGGT GCGAGCGACC CGGACGGCCC CGCAGACGAC 
GAGGCCGACG GCGGCCTCGG CTCCCTACTC GGCGGGACGA TGCCCGGCGC CGACGAGGCG 
GCCGCGATGC GCCAACTGCT GGAGTACCTC GACGACCCGC GGTTCGACCG CGTGATCGTC 
GACACCGCAC CGACGGGCCA CACCCTCCGG CTGCTCCAAC TCCCAGAGAT CATGGATTCG 
ATGATCGGCC GGGTGATGAA ACTCCGCAAC CGATTCTCCG GGATGATGGA CGGGATCAAG 
GGGATGTTTG GCGGCGGGGA CGACGACCCC GATCCCTCTG CCGACCTCGA CGAGCTCCGC 
GAGCGGATCG AGCGCCTCCG GAGCGTGCTG CAGGATCCCG AAAAGACCGA CTTCCGCGTG 
GTGACCATCC CCGAGGAGAT GAGCGTCACC GAGTCCGAAC GGCTCGTCGC GCGCCTCGAC 
GAGTTCGGGA TTCCGGTGAA CACCCTCGTC GTCAACCGGG TGATGGAGGG CGTCGGCGAC 
GTGACCGACG GGAGCGGGGC CGCGATCGAC CCCGAGTGGG TCGTCGAGCC GAACCCGGAC 
TCCTGTGAGT TCTGTGCGCG CCGATGGGAG GTCCAGCAGG CGGCACTGCG TCGGGCCACG 
GACCTGTTCC GCGGACGCGA CGTGAAGCGA GTCCCGCTGC TCGCGAAGGA AGTTCGCGGG 
GAGGCCGCAC TGCGGGTCGT GGCTGCGTGC CTACGCTGA

Protein sequence

MDDIDVEPVD RVEEPEINET ADADPASDAD LPTETDAATD LPAGVDAPDY VLYGGKGGVG 
KTTMAAATGL ASAAGGVNTL VVSTDPAHSL SDTYETEIPA KPARIREDMP LYAAEIDPDD 
AMEEGMFGAD GDPLGGMGEM GDAMGGMMGG ASDPDGPADD EADGGLGSLL GGTMPGADEA 
AAMRQLLEYL DDPRFDRVIV DTAPTGHTLR LLQLPEIMDS MIGRVMKLRN RFSGMMDGIK 
GMFGGGDDDP DPSADLDELR ERIERLRSVL QDPEKTDFRV VTIPEEMSVT ESERLVARLD 
EFGIPVNTLV VNRVMEGVGD VTDGSGAAID PEWVVEPNPD SCEFCARRWE VQQAALRRAT 
DLFRGRDVKR VPLLAKEVRG EAALRVVAAC LR