Gene Hlac_2684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2684
Symbol
ID	7400891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2672899
End bp	2674449
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	71%
IMG OID	643709758
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_002567325
Protein GI	222481088
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.989107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTCC GCCCGACCGA CCGCCCGGCG ATCGCCTGCC GCGATGTCCG GGCCGATACC 
GACGACACCC GACAGTCGAT CGACGGATCG GCCGAGTCGC CCGCTTCAAG CGGTTCGCCC 
GCTTCGCCAG TCCCGGGTGC CGACCGGTTC GTCGCGGCTG TCGCGGTCGA CGGCGAGGTG 
CTGTTCGCCG GTCCCTCGGT GCCCGCGGTG CTCGGGATCG AGCGGGCGAC CCTCGTCGGT 
GATGACCTCT TGGATTACGT TCACCCGAAC GACCGCGAGC CCGTCTCCGA CGCGCTCTCG 
GCGGTCGCGA CCAACCGCGT CGTCACCCAC CGGCTCCGCC ACGCCAACGG CGGGTTCGTC 
TGGGTCGAGT CGGTCGTCGA CGAGGAGTTA GCCCCCGAGT TCGGTGGGCG CGTCGTCACG 
GTGCGTCGCG TCGACGCCGA GCAGACCTTC CCGGAGCGGT TCCGGGAGTT CCTGGAGTAC 
GGCACGGATC TGGTCACCGT CGTCGACGCG GACGGGCGGG TCCGGTACGA GAGCCCGGCC 
GTCGAGGAGG TTCTCGGCTA CGAGCAGGGG TCGACCGTGG GGCGCTCCCC GCTCGGCTAC 
GTCCACCCCG ACGACCGCGA GCGCGTGACC GAGCGGTTCT ACCGCGCGCT CAACGATCCC 
GACGCGACCC CCACGATGGA GTACCGCTAC CGTACCGCCG ACGGCAACTG GGTCTGGCTG 
GAGTCTCGAA GCCGGTCGCT ACCCGACGAC GTCGCGGTCG GACGCCTGCT CATCAACTCG 
CGGGACGTGA GCGAGCGGAA GGCGCGCGAG CGCCGGCTCA CCGACCGCAA CGAGCGGCTC 
GACCGCTTCG CCAGCATCGT CTCGCACGAC CTCCGGAACC CGCTGTCGGT GATCCGAGGA 
TCGATGGAGA TGGCGGAGCT AAACGGCGAC ACAGAGCCCT TGGAGCGCGG CGAGCGCGCC 
GTCGACCGGA TCGACCAGCT GGTCTCGGAG CTGTTGACGC TCGCCCGGCA GGGCTCCGGG 
ATCGACGAGC CGACCGAGTT CGCGCTCGGT GGCGTCGCTC GCGAGGCGTG GGACACCGCC 
GGGAGCGCGG ACGCGACCCT CGTCCTCGGC GCGGATGCCC GAGTGTGCGG CGACCGCGGC 
CGGCTGCGAC AGGTGTTCGA GAACCTGTTC CGGAACGCGA CGGAACACGC CGCGCCGGAC 
GGCACAGACG CGATTCGATC GACCGACAGC GGCGAAGACG CCCCACTCAC CGTCCTCGTG 
ACCGCGACCG GCGGGGGATT TCTCGTCGCC GACGACGGAC CGGGGATCGA TCCGGCGCAC 
CGCGAGGAGG TCTTCGACCC TGGCTTCACG ACCCGCGAGG ACGGGACAGG CTACGGGCTC 
GACATCGTCC GCGAGGTCGT CGAGTCGCAC GGGTGGACGA TCGGAGTCCG GAGAGACGGC 
ACCGATCCGG CGTGCCCGGA CGACGTGACG GTCCCCGACG GGGCGTGCTT CGTGGTCGGA 
GGCCCCGACT CCGACGCGGC CGACGCGGAC GAACCGTGGA TCGACGGGTG A

Protein sequence

MTLRPTDRPA IACRDVRADT DDTRQSIDGS AESPASSGSP ASPVPGADRF VAAVAVDGEV 
LFAGPSVPAV LGIERATLVG DDLLDYVHPN DREPVSDALS AVATNRVVTH RLRHANGGFV 
WVESVVDEEL APEFGGRVVT VRRVDAEQTF PERFREFLEY GTDLVTVVDA DGRVRYESPA 
VEEVLGYEQG STVGRSPLGY VHPDDRERVT ERFYRALNDP DATPTMEYRY RTADGNWVWL 
ESRSRSLPDD VAVGRLLINS RDVSERKARE RRLTDRNERL DRFASIVSHD LRNPLSVIRG 
SMEMAELNGD TEPLERGERA VDRIDQLVSE LLTLARQGSG IDEPTEFALG GVAREAWDTA 
GSADATLVLG ADARVCGDRG RLRQVFENLF RNATEHAAPD GTDAIRSTDS GEDAPLTVLV 
TATGGGFLVA DDGPGIDPAH REEVFDPGFT TREDGTGYGL DIVREVVESH GWTIGVRRDG 
TDPACPDDVT VPDGACFVVG GPDSDAADAD EPWIDG