Gene Hlac_1224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1224
Symbol
ID	7399492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1233669
End bp	1235039
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	66%
IMG OID	643708289
Product	Anion-transporting ATPase
Protein accession	YP_002565887
Protein GI	222479650
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.916142
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000000394119
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCGAGCGT CGCCGCTCTC GACCGACCTG ATCCATCGTC CGATCGGCGA GTTCGCGGAA 
CGCCTGCGCT GGCTCCTCGC TCTTCTACAG CGACCGCGAG CCGTCGAGCG CGACGAGGAC 
GGCGTTCGCG CGCGGCGTGG CTCGGTACAT CCGCCACTTC CCCTCCTTCC GGCGCGTAAC 
GAGACCGGCG TCGGTGAGCT TCGAGAGGGC GTGGCTGATC GCACTGTCGC TCACGTCCAG 
AAGCGGCGAG AGCTCGCAGA CGCACAATTC GTCGCCGTCG GCCGCATGAA GCATCCGAAC 
GATCTTGTAC CGCGTCTCGT TCCCGAGCGC CGACAGCAAC TCGACGTCGG GACGGCGACC 
GACGTTGATG GCGCGGGCCA CGCTGACGCC GACGGTGCGA CCGACTTCGA CGCGGTGGCG 
GACGCCGACG CGGTCGTCGA CCAACTGACG CCGGGCGAGG AGACGCAGTA CCTTTTCTTC 
ACCGGGAAAG GCGGTGTCGG GAAGAGCACG GTCGCCTCAA CGGCGGCGAC GAAGCTCGCC 
GAAGCGGGCC ACGAAACGCT CGTCGTTACG ACCGATCCGG CCGCACACTT GGAGGACATC 
TTCGGCGAGC CCGTGGGCCA CGAGCCGACT TCGGTCGGGC AGGACAACCT CGACGCGGCC 
CGGATCGACC AGGAGAAGGC GCTCGCCGAG TACCGTGAGC AGGTCCTCGA CCACGTCACG 
GAGATGTACG AGGAGAAGGA GAACACGCAG ATCGACGTCG ACGCTGCGAT CGCGAACGTT 
GAAGAGGAAC TGGAGTCTCC CTGTGCCGAG GAGATGGCCG CCCTCGAGAA GTTCGTGAGC 
TACTTCGACG AGGACGGCTA CGACGTGGTC GTCTTCGACA CGGCCCCGAC GGGGCACACC 
CTTCGGCTGC TCGAACTCCC GTCCGACTGG AAGGGGTTCA TGGACCTCGG CTCGCTGACG 
AAGGGTGCCG CGCCCGCGAA GGGCGACCAG TATGACGAGG TCATCGAGAC GATGAAAGAT 
CCCAACCAAA GTACCTTCGC GTTCGTGATG TACCCCGAGT ACACCCCCAT GATGGAGGCG 
TACCGGGCCG CCGCCGACCT CGAAGACCAA GTCGGCATCG AGACTTCGTT GGTCGTCGCC 
AACTATCTCC TTCCCGAGGA GTACGGCAAC AACGCCTTCT TCGCGAATCG GCGCGCTCAG 
CAGGCGAAGT ACCTCGACGA GATCCGCGAT CGGTTCGACG CGCCGCTCAT GTTGGCGCCA 
CTCCGGCAAG ACGAGCCGAT CGGACTCGAC GAGCAGAGCG CATTCGGCGA GGAGATCACT 
GGGCTGGCGG ACATCGCTGA GGCGGATGCG CCGGAGGTGA CTCCCTCATG A

Protein sequence

MRASPLSTDL IHRPIGEFAE RLRWLLALLQ RPRAVERDED GVRARRGSVH PPLPLLPARN 
ETGVGELREG VADRTVAHVQ KRRELADAQF VAVGRMKHPN DLVPRLVPER RQQLDVGTAT 
DVDGAGHADA DGATDFDAVA DADAVVDQLT PGEETQYLFF TGKGGVGKST VASTAATKLA 
EAGHETLVVT TDPAAHLEDI FGEPVGHEPT SVGQDNLDAA RIDQEKALAE YREQVLDHVT 
EMYEEKENTQ IDVDAAIANV EEELESPCAE EMAALEKFVS YFDEDGYDVV VFDTAPTGHT 
LRLLELPSDW KGFMDLGSLT KGAAPAKGDQ YDEVIETMKD PNQSTFAFVM YPEYTPMMEA 
YRAAADLEDQ VGIETSLVVA NYLLPEEYGN NAFFANRRAQ QAKYLDEIRD RFDAPLMLAP 
LRQDEPIGLD EQSAFGEEIT GLADIAEADA PEVTPS