Gene Hlac_3340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3340
Symbol
ID	7402196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	92604
End bp	94025
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	55%
IMG OID	643709892
Product	hypothetical protein
Protein accession	YP_002567458
Protein GI	222481222
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAC AACCAGAATA TGGGACTCTT AGAATTACCA CACGAGGCAG CGAGCAGGCT 
TCTACTTCGA AATCTGTTCT CAGAACCTCA TCCAGACAAC AGCCGGGGCA TAACCCAATG 
AGTCACCCTG AGTCCGATCA GGAAAGCGAG CTCGAACCAC AGCAGCCTTC GTTCGACGAT 
GTCCGGTGGT CGGCCTGTTC ACTCGAAGAC TTCACACAGC TCTACTGGGA GCAGGTTGCT 
CCGTGTCTCG AAGCAGAAGG CCTTGATCCT ACGGCGGAGA AACCAACCCA CCAGTGGTTC 
AGTGATCACG GTGTGCGGTC ATTTCTCGCG GCCTTTCGTC GACACCACGA CCGATCTTTC 
GGAGAGTTCT GGAGTGAAGA TCTCGGACTT GGTGACGACG ATGACGGCTA CACTTGGGCA 
ACTTCCGATG AGCAAACAGT CGACGCACTC GAGCGATTCT TGGATCGTCG ACAGTCGCGG 
TACGGTCTTT CGACGTCTTC TGTCGACACC CTCCGAACGC GGCTGAACCT CTATGTCCGG 
GCGTACTCTG AGGCAAACGA CACGGATGAT CTCCTCTCGC CAATTCAACG TGATCGAGAC 
GCACCCGCAT ACGAAGCTGT CGATGCATGC TATGGTGCAT TTGACTGGCT GAATGAGGGG 
GCCGAACGCG AGTACAGTGC TCAGACCCTC CAACGGGTGC GACGCATCGT CGACGCTTGG 
TATCAGCATC TGGTCGGTCG ACGAATCGCT TCGATGAATC CCGCCAGCGG ATTGTATGAA 
GAATTCAAGT GGGAAACCAA AGACTCGCCG ACCCCATCAC TGTCAGCGGC CCATATTCGC 
CAGCTGATGG AGATGGAAAC GACCTCACGA GACCAACTAT TGGTGGTTGC CCTCGCTGGG 
TGGGGACTCC GAGCAGGCGA GGTCGCGGCA CTCCACATTT CGCAGTTCAA TCGCGATGTT 
CCCGACGACG ACGTCCCCCA TATCGCATTC GAGAGCCGTA AGAACGGTCC TGGAGAAGTA 
TCGGTACTGT TCGGTCTAGA TATCCTGGAC TCCCGAATTG ATGAACTTGG AGAAGATGAG 
ACGTGGGACG GATACTTGTT CCCCTCACCG CAGGGCCAAA TCCCACACGT AACGCGGGAC 
ACAATCCGTA ATTGGTTCCA AAAGCTTGCT TCAGAAGCCG ATCTTCCAGA TCGGATCGAA 
GGCGAGCGTC CGAGTCCGCA GCTCTGTCGA CGGTTCTGGT ATGATACCTA TACTGCAGTT 
CTCGAAGGAG TCCTCGAAGG CGTCGAAGAA ATAGCTGCAG AGCAGGGTAG TAGCGATCCA 
CAGGTCGTTA TGCAGAATTA CCTCTCCGAC TCACGATCTC GCCAGTTACG TCGCGAATTC 
ATGCGTGAGC AACTGATGGG AATCTTCAGG GGTGAGAGTT AG

Protein sequence

MTEQPEYGTL RITTRGSEQA STSKSVLRTS SRQQPGHNPM SHPESDQESE LEPQQPSFDD 
VRWSACSLED FTQLYWEQVA PCLEAEGLDP TAEKPTHQWF SDHGVRSFLA AFRRHHDRSF 
GEFWSEDLGL GDDDDGYTWA TSDEQTVDAL ERFLDRRQSR YGLSTSSVDT LRTRLNLYVR 
AYSEANDTDD LLSPIQRDRD APAYEAVDAC YGAFDWLNEG AEREYSAQTL QRVRRIVDAW 
YQHLVGRRIA SMNPASGLYE EFKWETKDSP TPSLSAAHIR QLMEMETTSR DQLLVVALAG 
WGLRAGEVAA LHISQFNRDV PDDDVPHIAF ESRKNGPGEV SVLFGLDILD SRIDELGEDE 
TWDGYLFPSP QGQIPHVTRD TIRNWFQKLA SEADLPDRIE GERPSPQLCR RFWYDTYTAV 
LEGVLEGVEE IAAEQGSSDP QVVMQNYLSD SRSRQLRREF MREQLMGIFR GES