Gene Hlac_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2119
Symbol
ID	7400639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2109336
End bp	2110418
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	55%
IMG OID	643709189
Product	hypothetical protein
Protein accession	YP_002566766
Protein GI	222480529
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.114431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAAT TATCTGCAGA AAAAAGTGAT AAAAAGGTAA CATCAATATC GCGCCGATCG 
TGGCTCAAAA CACTCGGAGT CGGCGCCTCT CTAATCAGCT TAGAGTCAGG GAGTGTTGCA 
GCGACGTCAG GCGGATACGG TATCGGTGGA TATGGTGCGA GTGAATACGG TGACTCGGAT 
ACTGGAGTAA CGGTCACGAC CGACGGAGCG AGCGACGTCG GCGAAACGAA TGTGACGCTC 
AACGGGTCAC TGACTGATCT GGGCGGCACC TCCTTCGTGG ACGTTTACTT TGAGTATCGG 
CACACCAACG TTACCACTTG GAGTGCCACC GCTACGCAAA CCGCCTCGTC AGCTGGTGGT 
TTCAGTGCCG CTATTACGGG TCTCGGAGAT GGCGTTGCTT ACGAATTCAG GGCCGTTGCG 
TTGACGAGCG ATGGGAATTC GGTTACCGGG TCACCGAGTA ACTTCACTAC CACCGAACAC 
TCCGTGGTCG TTTCAACGGA TGGTGCGACC GCTATCGGTG AAACGACTGC GACTCTCAAC 
GGCTCTGTGA CGGACCGCGG TAACGCAAAT TCAGCTGATA TCTACTTTGA GTACCGCGAA 
GCCGGGAGTA GCAGTTGGAA CGCGACAAGC ACACAGACAC TTACCTCAGC GGAAAGTTTC 
ACACAGAATC TGAACAACCT AAAGAGTGGT ACGGACCACG AGTTCAGAGC AGTCGCACTG 
GCTAGCGACG GTGACACTGA TACTGGAGGC TCGGTCACAT TTGTGACGGT GACCGCCGAG 
AGCGATCCAG CTGTCGGTAC GTTCAGTATT TCAGAGGCTG GCTCGCCGAA TCCACACGCA 
GAAATCAACG TTGACTGGGC TGTTTTCGAC GTGGACGGCG ACCTCAGTCT GGTCACCGTC 
TCAGTTGCTG ATTCAACTGG GGCAACTGTG AAATCCAGCA CGACGTCCGT TAGTGGTAGC 
AGCGTCTCAG GATCTGATTC GCTCAAAATC AAACACGGGG GCGGCGAGGT TTACGAGGTC 
ACGCTCCGTG TAGAGGACAA CGCCGGCAAC GTTGTCACTG AAACGGGGTC TGTGTCATCC 
TGA

Protein sequence

MEKLSAEKSD KKVTSISRRS WLKTLGVGAS LISLESGSVA ATSGGYGIGG YGASEYGDSD 
TGVTVTTDGA SDVGETNVTL NGSLTDLGGT SFVDVYFEYR HTNVTTWSAT ATQTASSAGG 
FSAAITGLGD GVAYEFRAVA LTSDGNSVTG SPSNFTTTEH SVVVSTDGAT AIGETTATLN 
GSVTDRGNAN SADIYFEYRE AGSSSWNATS TQTLTSAESF TQNLNNLKSG TDHEFRAVAL 
ASDGDTDTGG SVTFVTVTAE SDPAVGTFSI SEAGSPNPHA EINVDWAVFD VDGDLSLVTV 
SVADSTGATV KSSTTSVSGS SVSGSDSLKI KHGGGEVYEV TLRVEDNAGN VVTETGSVSS