Gene Hlac_3423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3423
Symbol
ID	7402271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	170674
End bp	171945
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	49%
IMG OID	643709966
Product	hypothetical protein
Protein accession	YP_002567532
Protein GI	222481296
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCCCT CAGAAATAGA TGGCAAAGCG ATTCAGTCGT TCTCTGCCTA CAGCCCCAGT 
ACTTTGTATG TTACAGTATT CGACAACACT GTGCCTGAGA CCACAATAGA GGCCCACCTG 
CAAGAAATTG AGGAGCGACT GGCTGATGTT AACCGACCAC CAGCAACCAC ATTAGACATT 
CTTGGGGAAG CCAAACGCGA ACGATACTGG GAGAACCTGC TTGTCTATTT TCTTGACCCC 
GAAAACCCTC ATGGATTCGG AACAGATGTT CTTAGAGTAT TCCTACAAGC ACTTGCTGAA 
CACGAGGAGA CTGTGCTTCC ACTTCAACAG TCCAAGCTCG GAGAGGTCAA GGTTCAATCG 
CAGGTTCCTA CCGGCAAGGG GCCTTTTGAT ATCTTCTTGT GGAGCAAAGA TGCCTGGTAC 
GTCGTTATCG AGTTGAAAGT CGCTGCAGCT GAAACGAGAA CTCAAACAAA ACGATATGCC 
CAGGCCTCAA AGCTGGGCGA CCTCAACGTG AGCCGACACG ATGGGACGAG TGAGTACGTT 
TACCTCGCCC CCCGAAGTGC AGGTGCATCG ACATCTGAGA CATTCGTCGA TGTATCATGG 
GAGCACATCG TCCCCTATCT CGAAGATGTA CTGACGACAA GTCATGGCCA ATATCCATCG 
AAAAGTCACG CCCAGCTCGC TGATTACCTC GACACAATAA GACAGACACT CAATATGGAC 
GATTTCACCA CCATCTCAGA AGAGACGAAA CTGTACACCG AATACTCCGA TACGATTGAT 
CGACTCGTTA AGGCCTACAA AAACGATAAA GCCAAGATTT TCAATCACCT TCAGACGGCT 
TTTCTCGATG CACTAGACGG CCCCAAAAAA GACTGGACAG TAAACAATCG ACCGAAGACG 
TACATCAACT TCGCCAAAAT AAACTGGGAG AACGTGGCGG GTAATGTCCG AATCGAATAT 
GAACCCCATG TCCATCTCAA CCGCGATCAT CCAGAAATTC GGCTCCGCCT CGATATCGAA 
AATTCAGGAA ATCAGCAAAT AAGAGAAGAG TTCAGCGAGA AACTAGGTCA GGAAGACTGG 
GAAGCATTAG AAGACGCCGA CTGGGAAGTC GTTGATGGTA GCTACGCGTA TCTCGCAAAA 
TCAGTTCCGT TCGATACGGA ACATCCAGCG GACTCAATTC GTCGTACTAT CCAAGAACTC 
AATGGTCTCC GTGCAATCGT TGAGCCATAT ATCGACGGAA TCGTGCAAGA ACATCAGAAT 
AGCACCCACT AG

Protein sequence

MNPSEIDGKA IQSFSAYSPS TLYVTVFDNT VPETTIEAHL QEIEERLADV NRPPATTLDI 
LGEAKRERYW ENLLVYFLDP ENPHGFGTDV LRVFLQALAE HEETVLPLQQ SKLGEVKVQS 
QVPTGKGPFD IFLWSKDAWY VVIELKVAAA ETRTQTKRYA QASKLGDLNV SRHDGTSEYV 
YLAPRSAGAS TSETFVDVSW EHIVPYLEDV LTTSHGQYPS KSHAQLADYL DTIRQTLNMD 
DFTTISEETK LYTEYSDTID RLVKAYKNDK AKIFNHLQTA FLDALDGPKK DWTVNNRPKT 
YINFAKINWE NVAGNVRIEY EPHVHLNRDH PEIRLRLDIE NSGNQQIREE FSEKLGQEDW 
EALEDADWEV VDGSYAYLAK SVPFDTEHPA DSIRRTIQEL NGLRAIVEPY IDGIVQEHQN 
STH