Gene Hlac_3173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3173
Symbol
ID	7399302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	-
Start bp	403254
End bp	404507
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	62%
IMG OID	643706973
Product	hypothetical protein
Protein accession	YP_002564595
Protein GI	222476074
COG category	[S] Function unknown
COG ID	[COG4983] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATATG AGCCACCACT TGCTGTCTCG GAGTGCCCGG AGACGTTACG CGAACGCGAG 
CAGTGGGTGT GCTGGCGGGA AGAAACACGC GACGGTAAAC CGACGAAAGT ACCGGTGACG 
CCAGGGACAG GAGGATTCGC GTCGTCGACA GACCCCGAGA CGTGGGATGC CTTCGAGACA 
GCACTCGAAT ACACCGAGAC GGAGCACGCT GATGGTGTCG GGTTCGTATT CACTGACGAC 
GATCCCATCG TCGGCGTTGA CCTGGACGAC TGCCGCGATC CCGAAACGGG CGACGTCGAC 
GACGCCGCAC AAGACATCAT CAAGCGACTC GACTCCTATA CGGAGGTATC GCCGTCCGGT 
ACCGGCTATC ACGTCCTGAT CACCGGCGAA CTTCCCGAAG GACGGAACCG TCGCGGGAGC 
GTCGAACTGT ACGACACGGC ACGTTTTTTC ACCGTCACTG GCGACCACGT CGATGAGACT 
CTCGGTCGCG TTGCACGTCG ACAGGACGCG CTCACAGCGA TTCACCGCGA GTACGTCCAG 
GACACCGAGC GTGACACAGC ATCCGAGTCC GAGCCGGGGA ATGGCACTGA CGACCAGTCA 
ACGGCGACCG GGACAGCCGA CGTCGACGTT GATCTCGAGG ATGAGGACCT CCTCGAGAAA 
GCGCGAAACG CGTCGAACGG CGAGAAGTTC GAGCGGCTCT GGAACGGGAA TACGGTCGGC 
TACGACAGTC AGTCCGAGGC CGATATGGCC CTGTGTTGTC TGCTGGCGTT CTGGACCGGT 
GGCGACCGGA CGCAGATGAA GCAGCTGTTC CGGCAGTCGG GATTGCTTCG GGAGAAGTGG 
GACGAGGTCC ACTACGCTGA CGGGTCGACG TACGGGGAGA AGACCATCGA GCGAGCGATT 
GCGACCACGT CGGAGTTCTA CGACCCGGAC GCCGGCGACG ATACCGCGGA CGACACCCCC 
GGCGGATCGT CTCCAGACGT CGGCGCTGCT GACTCGGAAC GGAGTCGCGC GTATCTAGCC 
GAGAAGAATC GGCTATTGAG CGAGCGCGTC GACGAACTCG AGGCGACACT CACGGAGAAA 
ACCGAGCGCA TCGACGCTCT CGAAGCGGAG ATCGAGCGAC TCACTGACGA ACTCGCTACC 
CGTGGCCGGG AAGAAGAGTC CCAGGGCGAG CACGTCTCTA CTGCGAATGA GAACGGTGCT 
GAGTCAGAGT CATCCTCTAT GTTGAGTCGA TTATTCGGCG GTCGGTTCGA GTAG

Protein sequence

MEYEPPLAVS ECPETLRERE QWVCWREETR DGKPTKVPVT PGTGGFASST DPETWDAFET 
ALEYTETEHA DGVGFVFTDD DPIVGVDLDD CRDPETGDVD DAAQDIIKRL DSYTEVSPSG 
TGYHVLITGE LPEGRNRRGS VELYDTARFF TVTGDHVDET LGRVARRQDA LTAIHREYVQ 
DTERDTASES EPGNGTDDQS TATGTADVDV DLEDEDLLEK ARNASNGEKF ERLWNGNTVG 
YDSQSEADMA LCCLLAFWTG GDRTQMKQLF RQSGLLREKW DEVHYADGST YGEKTIERAI 
ATTSEFYDPD AGDDTADDTP GGSSPDVGAA DSERSRAYLA EKNRLLSERV DELEATLTEK 
TERIDALEAE IERLTDELAT RGREEESQGE HVSTANENGA ESESSSMLSR LFGGRFE