Gene Hlac_3082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3082
Symbol
ID	7399053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	-
Start bp	336864
End bp	338222
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	60%
IMG OID	643706886
Product	protein of unknown function DUF790
Protein accession	YP_002564508
Protein GI	222475987
COG category	[S] Function unknown
COG ID	[COG3372] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGACCG CGAACCTCGC CCGGTCACGC ACGACCGACG AAGAAGTCAA ACCGCTGTTC 
ATCGATCCCG ACGAGGAGCG CTACCAACAG ACTGCTCGAG AACTCATCCA GCTGTTCGAG 
GCCCATCTCG GTGAGCCGAA AGGCGACCTC GAGGACGCGA TTGACGAGCT GACCATCGCG 
GATACCGACT ACAAGATCGT CCAAGGGCTG GCGAAACTCC TGAAAGACGA GTGTGAGTTC 
GAGGTCGTCG CCTCCGTCGA ACCGCGTGAG ATCCGCCGGC GACTCTTCGA GAAAGCCAAC 
GAGCGCTATC CGATCGTCCG CCAGCCGACG CTGGGCGAGG ACACACAGAA GCTGGAGGTG 
TACAGCGCGG TCGCCGACGA CCTCGGGGTG TCGTTGGAAG AGTGCTATCG CGGGATGTAC 
GCCGATCTCG AAGACAACAA ACGACTCGTC CGAATCGGAA CGCGGACGGC CGACCAGTAC 
GCCAGTGATG ACGATACGTC GACGTCGACG ACCAACCTGA CCGGCAGCAG CGACGCGGAG 
TATGAACACA CGGGTCTCAC CGTGGACTGG TTGGTGACCC GGTACAACCT CGCGCTCGCC 
CAGGCGGTGC TCTACGACGC CACAGAAATG CGGATTCGGG TGTGGGACCA CTTCGGGACG 
GTGTTCAGTT ACGTGAAGCT GTTCGGGTTG ATGCATCGCA TCTATCCGAT CGACAGCGAC 
GGTGAACGCG TCGCGAACAC GGACCAAGCC GCCGGCTACG AGGCCGTACT GGACGGCCCG 
GCATCGCTAT TCTCAAAGTC GCAGAAGTAC GGGATTCGCA TGGCGAACTT CCTGCCGGCA 
TTGCCCCTCT GTGACCGCTG GGAGATGGTT GGTGAGATCC TCGTCGACGA GACGACCGGC 
GAGACCCGAC AGTTCGCGCT CGACCCCACG GAGGATCTCG ATTCACACTA CAGCGCGGGC 
GACCAGTTCG ATAGCGACGT CGAGCGGACG CTCGCCGATA AATGGGAGCG AGCGAATACG 
GACTGGAAGT TGGTGCGGGA AGACGATGTC TTCGACCTAG GTGCTGAGGT GATGATTCCC 
GACTTCGCGA TCGAACATCC CGATGGCAGG CGTGCGATCC TCGAGATTGT CGGCTTCTGG 
ACGCCCGAAT ATCTGGACGC GAAACTGGAG AAGATTCGAA AGGTGGAGGC CGACAATTTC 
GTGCTGGCTG TCTCGGAGCA ACTGGATTGT GCGAGCGAGG AGTTCGGGAG CGCCGCCGAT 
CGAGTGCTGT GGTTCAAAAC GGGAATTCAC GTCTACGATG TAGTCGATTT AGTTGAGCAA 
TACGCGACAG GGATGTCACA GAGTGAAGAG CAGGCTTGA

Protein sequence

MLTANLARSR TTDEEVKPLF IDPDEERYQQ TARELIQLFE AHLGEPKGDL EDAIDELTIA 
DTDYKIVQGL AKLLKDECEF EVVASVEPRE IRRRLFEKAN ERYPIVRQPT LGEDTQKLEV 
YSAVADDLGV SLEECYRGMY ADLEDNKRLV RIGTRTADQY ASDDDTSTST TNLTGSSDAE 
YEHTGLTVDW LVTRYNLALA QAVLYDATEM RIRVWDHFGT VFSYVKLFGL MHRIYPIDSD 
GERVANTDQA AGYEAVLDGP ASLFSKSQKY GIRMANFLPA LPLCDRWEMV GEILVDETTG 
ETRQFALDPT EDLDSHYSAG DQFDSDVERT LADKWERANT DWKLVREDDV FDLGAEVMIP 
DFAIEHPDGR RAILEIVGFW TPEYLDAKLE KIRKVEADNF VLAVSEQLDC ASEEFGSAAD 
RVLWFKTGIH VYDVVDLVEQ YATGMSQSEE QA