Gene Hlac_1627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1627
Symbol
ID	7399576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1647244
End bp	1648383
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	643708693
Product	putative signal transduction protein with CBS domains
Protein accession	YP_002566282
Protein GI	222480045
COG category	[K] Transcription
COG ID	[COG2524] Predicted transcriptional regulator, contains C-terminal CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.759399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTG TTGATATTGC GGTGCCGGAG TACGTCGAGG TCGACGTCAG TGAGCGACTC 
GCTAAGGTCC GGTCCATCTT CGAGCGCGAG AACCCGAAGG GGATCATCGT CACCGAGGAC 
GGCGAGTACG CGGGCGTAGT GGGAGAAAAA CAGCTCATGC GCTCCCGGAT GGAGGACGAC 
ACCAAGGTGT CGGCCGTGAT GAAATCGGCC CCGTCGGTCG ACCGCCACGA GGACCTCCGT 
GAGACCGCCC GGCTGCTCGT CGAGGGCGAC GTGAAGATCG CACCGGTCTA CGAGGGCGAG 
AAGCTCTACG GGATCGTCAC CGTCGACCAG ATCCTCGAGG CCGTCCTCGA CAGCCTCGAC 
GCGATCACCG TCGGCCAGAT CGCAACCGAG GACGTGATCG GAATCAACGA GAAGGACACC 
GTCGGGAGCG CGATCAACCG CCTTCGCGAG AACGGGATCT CCCGGCTCCC CGCCCTCGAC 
GAGGACGGCC ACCTCGTCGG CGTCGTCACC ACCAACGACA TCGTCGAGTT CGTCGTTCGC 
GATCAGGAGC GACAGGGCAG CGGCGACCGC GCTGGCGACA TCGACCGGAT GCTCGATATC 
CCCGTTTACG ACATCATGTC GAGCCCCGTC GTCACCGCGA CCGCCGACGA GACCGCGGAG 
GCCGTCGTCG AACGCATGTT CGACAACAAC GTCTCCGGGC TGGTGGTCAC GCCGAAGGGA 
GCTGACACCA TCGCGGGCAT GGTGACGAAA ACCGACGTGT TGCGCGCGCT CACGTTCACC 
GAGCAGGACT CGATGGACGT ACAGATCACC AACGTCGCCC TGCTGGACAC GACCTCTCGT 
GAGCACATCG TCGAATCCAT CGAGCAGGTC GCGAGCAAGT ACGCGGATAT GCACGTCATC 
CACGCGCACG TCCGGCTCCA CGCCCACAAG GAGAAACTCC GCGGCACCCC CCTGATCCAG 
TGTCAGATCC GCCTCCGCAC CAACGAGGGA CAGGTCGGCG GCTCCGGCGA GGGATACGGC 
GCCGAACACG CCTTCCACGT CGCGCTCGAC AAGCTGGAGC GCAACGTTCT CGAAATCAAG 
GGCGTCAACG CCGACGAGGA GTACCGCGGC CAGCTCCTCC GCAAGCTCGG CGAGCTGTAA

Protein sequence

MNIVDIAVPE YVEVDVSERL AKVRSIFERE NPKGIIVTED GEYAGVVGEK QLMRSRMEDD 
TKVSAVMKSA PSVDRHEDLR ETARLLVEGD VKIAPVYEGE KLYGIVTVDQ ILEAVLDSLD 
AITVGQIATE DVIGINEKDT VGSAINRLRE NGISRLPALD EDGHLVGVVT TNDIVEFVVR 
DQERQGSGDR AGDIDRMLDI PVYDIMSSPV VTATADETAE AVVERMFDNN VSGLVVTPKG 
ADTIAGMVTK TDVLRALTFT EQDSMDVQIT NVALLDTTSR EHIVESIEQV ASKYADMHVI 
HAHVRLHAHK EKLRGTPLIQ CQIRLRTNEG QVGGSGEGYG AEHAFHVALD KLERNVLEIK 
GVNADEEYRG QLLRKLGEL