Gene Hlac_1958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1958
Symbol
ID	7399910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1957838
End bp	1959244
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	67%
IMG OID	643709029
Product	AAA ATPase central domain protein
Protein accession	YP_002566606
Protein GI	222480369
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0464] ATPases of the AAA+ class
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.268075
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACC CGGCGCTCGA CGTCGTCGAG TTCGTGTTGA CGACGCACCT CTACACCGAG 
AACCGCGACC TCGACGAGAA CGACCTGCCG CCGCGCTTCC GACAGGTGTT CTGGTCGGAT 
GACGCCGCCG ACGACGCCCC GGGCGGCGTC GAGCGGCCGC TCAAGGCGAC GAGCGAGACA 
ACCCGCACCG CAACGGGCGT TGAGCACCCG TGGGACGCCG TTTCCGACCT GCTCTTTACC 
CAGCGGACGG AATTCTCCGG CGAGATATCC CTGACCCAGC CGGCGATGGC GCTGGAGTGG 
TATCGCGACC ACGCCGACGA CGAGCGAATC GCCGCCAATC CGACGGTCGT CGCCGCGCTG 
GAGGCGTCTG ACGACCTCGA CGCGCCCGTG ACCCACGAGG AGGCGCGCGA CAGCGTCCGA 
CCGATCCAAG CCGATCGCGT CTGGATCGAC GCCCTCCTGG AGGAGTACTT CGACGAGGAC 
GAGGACGGGG AGATGCTCGA CCTCGTCAAC GTCCGCGCGC CCGAGGAGAT CGAGACGACG 
CTCGCTGACC TCGTGCTCAC GGGCGATCAA GAGGGCGAGA TACAGAAGAT CGTGAAAGCG 
ATCGAACACC GCGAGTACCT CGCGAGCATC GGGCTTCGCG AGATCGGGAA GCTGCTGTTC 
GTCGGTCCGC CGGGGACCGG GAAGACAACC GTCTCGCGGG CGCTCGCGCA CGAGCTCGGT 
ATCCCGCTCG TCGAGGTGAA AATGTCGATG ATCACGAGCC AGTACCTCGG CGAGACGGCC 
AAGAACGTCG AGAAGACCTT CGAGGTCGCA AAGCGGCTCT CGCCGTGTAT CCTCTTCATC 
GACGAGTTCG ACTCGGTGGC GAAGACCCGG CGCTCCGACG AGCACGCCGC CCTGAAGCGC 
GCGGTCAACA CCCTCCTCAA GTCGATCGAC GAGGTGTCGC TCGTGCGCGA CGAGGTCCTC 
TTGATCGGCG CGACCAACCA CCCGGACCAA CTCGACGCGG CCGCGTGGCG CCGCTTCGAC 
GAGATCGTCA ACTTCCCCAA GCCGGACCGT GACATGCGCG CGGACATCCT CCGGGTCGTC 
ACCCGCGAGA TGCAGATCGC CGACTTCGAC CCCGAGGAGG TCGCCGACCG AACGACCGGG 
CTCACGGGCT CGGACCTCCG GATGGTGCTG CGCGAGGCGG TCCTCGGTGC GCTCACGGAA 
GACCGGATGA CGATCACGCA GCAGGACGTG ATGGAGGCCG TCGAGGACTT CGAGGAGCGT 
GACAACCTCA AGAATATGGA CATGATCGAC GGCGAGGGCG CGGAGGTGCT CGGCGAGACG 
GACCCCGACG GGCAGGACCA CACCCACGAC GACGAGGGCG ACGACACCGC CCACGACCAC 
GGCGCGCACA GCCACTCGCA CGACTAA

Protein sequence

MSDPALDVVE FVLTTHLYTE NRDLDENDLP PRFRQVFWSD DAADDAPGGV ERPLKATSET 
TRTATGVEHP WDAVSDLLFT QRTEFSGEIS LTQPAMALEW YRDHADDERI AANPTVVAAL 
EASDDLDAPV THEEARDSVR PIQADRVWID ALLEEYFDED EDGEMLDLVN VRAPEEIETT 
LADLVLTGDQ EGEIQKIVKA IEHREYLASI GLREIGKLLF VGPPGTGKTT VSRALAHELG 
IPLVEVKMSM ITSQYLGETA KNVEKTFEVA KRLSPCILFI DEFDSVAKTR RSDEHAALKR 
AVNTLLKSID EVSLVRDEVL LIGATNHPDQ LDAAAWRRFD EIVNFPKPDR DMRADILRVV 
TREMQIADFD PEEVADRTTG LTGSDLRMVL REAVLGALTE DRMTITQQDV MEAVEDFEER 
DNLKNMDMID GEGAEVLGET DPDGQDHTHD DEGDDTAHDH GAHSHSHD