Gene Hlac_3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3354
Symbol
ID	7402209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	110272
End bp	112239
Gene Length	1968 bp
Protein Length	655 aa
Translation table	11
GC content	47%
IMG OID	643709905
Product	hypothetical protein
Protein accession	YP_002567471
Protein GI	222481235
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAACT ACGAAGACTA TCTAGAGCAC TTCTTTGACA ACGCAGAGGC CTCTATCCGA 
GAAGGAAAAG GCCAGGAGCT CTCAGACAAT CTTTCTCACA TCGCAGAGCT GATTCATGAA 
CTAATCGACA AGGAGGTGGA TTCAAAAAGA CAGTTCCGGT CGAACTACGC TTTCTGCAGA 
CGACAGTACA TCCAGCTGTA CGATACAGTG CTTGAGAACG GAGCTGACGA AGATCTAAGA 
ACAAGCATTA TCGACTCGAT ATCAGCTATC ACCAATTACT CCCGCCAAGC AAATGATATA 
GAGGCCTTCG ACCAACTGCT TAACTCCATC ACAAGCTGCT ATAGACAGTC ATACCCCCAA 
CCCGGATTTG ACGACGCTGT AGGGAATATT TTCGAGAGAT ACAGTCATAT CCAGCACGGA 
GTAACACAGA ACTTCGAAGA CGTAGACAGT GTCGACAGAT TAGCCAAAAG CCAGGAAATC 
ATCGACACCC TTCTCCAGTA CTACCGTGAA CTCTGGCGGT GGTCTATTGA AAACGGATGT 
AAGGAGTCTA TCAAAAGACT GCATCACAAT CTGGATGACG TAAGAGCATT TGAACGAGCC 
CAATACTTGC CGATAGGAAC CCCAGAGAGC GAATACAACG AAGACTTCCT TGATCAAAAG 
CAGGAGATCG CTAACACCTT CCGGAAGCGA ATCCAGATAC AGAAATTTGC CGGCTACTCC 
TGGGGATACA ACCTCTACGT AAAGGGGATA ATATCTGAGG AAGAGTTTAT CGAGGAACTG 
CTTCAGAAAT ACGCCGAGCA GAACTTTTCC TCCATTAGCT CTCTTACAGA GACCTACTTC 
GAGATTCAAT CCATTCTCGG TGAGGTACCT TACTGGGAAG AGTGGGAGAC AAACAGACAA 
CTACAGCAGT CACTCGGCCC AGTCATGACT TCTATGGGGA CAAACAGTTG GATTCCCTCT 
TTCTACCTAG CGTTTTCACT GTATCTCTTC GACGAAGACA CTCAAGAGAA CTTCTCAAAC 
TCAACTCCTG AAGAACTGCC TTTCCCCACA GGAAGCAAGG AACGTATTGA GATCAACAGT 
CTACGGGATG CGATTGAAGG ATTTGAAGAC GACTATCCTC TGGACTTCCT TCTAGACGAC 
CAGACGGACA TAAATGACAG AATCGAGAAA CTGTCTGAAA TCCTCAATCG AGCGCATTCC 
TACGCTGAGA AACAGGATAT AATGCGGATG CGGAATCATC CCATCGAATC AGAGTACGTC 
GACTCTTGGG AAAAAGAGGT CAACGACCAA TTCGATAGCT CATGTCTGTT GAGACAAGCG 
CTGAAAGAAA TCGGGTTGCT GAAGCAGAAA CCGTTCCCCC CGGATCTTGA CGGTATCAAG 
GTCTCAGTTG GATATCCGCG TAAGCGAAAC TTCGTGCCGG AAGAAGCAGT ACACAAATCT 
CCAACAGGCA ACTTCCGAAG TATCTTAGAC GATTATCGAG AGTATGTTTT GAGGCGGCTG 
ACCTTAGAGG AGCACACCGT AGACACTGTT GACGAGTTAC TCGATGAAAT CGAGGATCAA 
GTGGAGAGAC GAGATCCGTC AGTGATTCTC TTCAAGACTG GAGAGCACCG CAGAAAGCTT 
TTAGAAGATG ACCGGTTCAC ACATGGAAGC GATTTCCCTA ACTCCCATCA CACGTTCTTG 
GACATCCCTG TTCTCACTGA ACCCACTGAA ACGTACAACG CTCTCCTGCT TCTAGAGAAC 
GAAAGTCACG GTGTAGAGTT CGTTGAAGAC GATATCGTAT TCAATCTGGA AGCTACGCCA 
GGAGAGGAAG CCGAGGTAAT TGATATGCCG AACAAGCCTC TGGAGTCAAT TCCATATACT 
AACGCACCTC ATGACTTTGT AGAGATGGAA GTCCGGCTCC GAGGATACAT ACAGACTGAG 
GAGCTCGATG GGGTACGCTT CCAAATCAAC TCTGAGGTTC CAGAATAG

Protein sequence

MPNYEDYLEH FFDNAEASIR EGKGQELSDN LSHIAELIHE LIDKEVDSKR QFRSNYAFCR 
RQYIQLYDTV LENGADEDLR TSIIDSISAI TNYSRQANDI EAFDQLLNSI TSCYRQSYPQ 
PGFDDAVGNI FERYSHIQHG VTQNFEDVDS VDRLAKSQEI IDTLLQYYRE LWRWSIENGC 
KESIKRLHHN LDDVRAFERA QYLPIGTPES EYNEDFLDQK QEIANTFRKR IQIQKFAGYS 
WGYNLYVKGI ISEEEFIEEL LQKYAEQNFS SISSLTETYF EIQSILGEVP YWEEWETNRQ 
LQQSLGPVMT SMGTNSWIPS FYLAFSLYLF DEDTQENFSN STPEELPFPT GSKERIEINS 
LRDAIEGFED DYPLDFLLDD QTDINDRIEK LSEILNRAHS YAEKQDIMRM RNHPIESEYV 
DSWEKEVNDQ FDSSCLLRQA LKEIGLLKQK PFPPDLDGIK VSVGYPRKRN FVPEEAVHKS 
PTGNFRSILD DYREYVLRRL TLEEHTVDTV DELLDEIEDQ VERRDPSVIL FKTGEHRRKL 
LEDDRFTHGS DFPNSHHTFL DIPVLTEPTE TYNALLLLEN ESHGVEFVED DIVFNLEATP 
GEEAEVIDMP NKPLESIPYT NAPHDFVEME VRLRGYIQTE ELDGVRFQIN SEVPE