Gene Hlac_0318 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0318
Symbol
ID	7399708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	340893
End bp	342665
Gene Length	1773 bp
Protein Length	590 aa
Translation table	11
GC content	67%
IMG OID	643707380
Product	putative PAS/PAC sensor protein
Protein accession	YP_002564992
Protein GI	222478755
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.375606
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.106516
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGATT CGCCGGATCC TGCAGTCCTT TTGGATCTCG CAGGAGACAA GATCGCCGTC 
CTCGACGAAG ACGGGATCTT CCGGCACCTC AACGCGGCCG TCGCCGACTT GCTCGGGTTC 
CACTCGGACG ACCTCGTCGG GACGGACGCA TTCGCGCTCG TCCACCCCGA CAACGAGGAG 
CGGCTCCAAG AGACCTTCGC GCGGATCGTC TCCGGGGAGC TGACACCCGA CGAGCCACTG 
GAGTACCGGT ATCGCACCGC CGACGGTGGG TGGGTATGGC TCCGGACGAC GGTGCACCCG 
CCCGAGGAGA CGGAAATCGA CGGGTACGTC CTGACCTCGC GGGACATCAC GAGCGAGGTC 
GAGTCCCGGC GCCGACTGGA GACGATCGCA TCGGCCTCGT CCGACGTGTT CTGGATGTTC 
TCCGCCGAGT GGGACGAGCT GCTGTTCATC AGCGACATCG TCGAGGAGGT CTTCGGCGTG 
TCGAGGGACA CGCTCGAACG GCAGCCAAAT CGGTTCCTCG ACGTTGTCCA TCCCGATGAC 
CGCTCATACG TCGAGCGAGC GATGGACCGA CTCTCGAACG GCGAATCGAC GCTGATCGAC 
TACCGACTGG GGTCCGCCGA CGGGACCACG AAGTGGGTCC GCGTGCCCGG CGAGCCAGTG 
ATCGAGAACG GCACGGTCGT GGCGGTCACG GGCTTCGCCC GCGATGTCAC CGACGAGTAC 
CGCCGCGAGC GACAGCTCGC CGTGATGGAC AACCTTCTGC GACACACGAT CCGCAACGAC 
ATGAACATCG TCGACGGGAC CGCGGAGCGC ATCGTTGACG CCGTCGCTGC CGCGGACGCG 
TTCGATCCGG AGGCGTGGGG CGACAGCGTC GCGGCCGCGG AGGGTAACGC CGAGATTGGT 
CCTGACGCCC TCGCCGAACT CGGGGCGGAC CTACAGGAGC ACGCGGAGAC GATCCGACGG 
ATCGCCTCCG ACCTGTTGGC GACGGCAGAG AAACAGCGCG GGGTGATCGA CCTGCTGCGA 
CAGCGCGGGT CACCCCGAGC GGTCGAGGTG GCGCCCGTGG TCGAGGAGGC GCTCGGAATG 
GTCGTCGACG ACTGCGACGA GACGGTCGAC GTCACCTACC GCGAGCCGGT CGACGGAGAG 
GGCGCGAGGG AAGGCGAGCC CGGAGACGAG ACCGAGAACG TGGACGGGAT GGCGAGTGAG 
GAGACGGCAG GCGAGGGGAC GACGAATGAG GAGACGGCAG GCGAGGAGAC GGCGGGCGAC 
AACTCGACAC TCCCGCGGGT ATCGGTCTCG TACCCGCCGA ACGCGAAGGC GTTCACGCAT 
CCGGAGCTCG ACTACGCGAT CGCGGAGTTG GTCGAGAACG CCCTCGAACA CGCGGAGTCG 
ACGCCGCGGA TCCGGATCGA CGTGTGTACA ACCGACGAGT CGATCGAGGT GTCGATCCGC 
GACAACTGCC CGCCGATCCC GGTCGAGGAG CGATACGTAA TCACCGACCG ATGGGAGATG 
GACGACCTCC GTCACACCGG GGGGATGGGC TTGTGGCTGG TGTACTGGGT CGCAAACCGG 
TCGGGCGGCG ACCTGACCTT CGACACCCAC GCCGACGGGA ACGTCGTGAC GCTCTCCGTT 
CCGAACGCGA AGTGTGGCAC GATCAACGAG GATCCACGGG AGACGACCCT GTCAAACCGC 
CCGATGACCG CCGCAGTCGA GGGGGCAGAC ACGCGCATTC GGACCGACGG ATCCACCACC 
TCGGAACCGA AACGGCGCGA CGAGACGGAC TGA

Protein sequence

MSDSPDPAVL LDLAGDKIAV LDEDGIFRHL NAAVADLLGF HSDDLVGTDA FALVHPDNEE 
RLQETFARIV SGELTPDEPL EYRYRTADGG WVWLRTTVHP PEETEIDGYV LTSRDITSEV 
ESRRRLETIA SASSDVFWMF SAEWDELLFI SDIVEEVFGV SRDTLERQPN RFLDVVHPDD 
RSYVERAMDR LSNGESTLID YRLGSADGTT KWVRVPGEPV IENGTVVAVT GFARDVTDEY 
RRERQLAVMD NLLRHTIRND MNIVDGTAER IVDAVAAADA FDPEAWGDSV AAAEGNAEIG 
PDALAELGAD LQEHAETIRR IASDLLATAE KQRGVIDLLR QRGSPRAVEV APVVEEALGM 
VVDDCDETVD VTYREPVDGE GAREGEPGDE TENVDGMASE ETAGEGTTNE ETAGEETAGD 
NSTLPRVSVS YPPNAKAFTH PELDYAIAEL VENALEHAES TPRIRIDVCT TDESIEVSIR 
DNCPPIPVEE RYVITDRWEM DDLRHTGGMG LWLVYWVANR SGGDLTFDTH ADGNVVTLSV 
PNAKCGTINE DPRETTLSNR PMTAAVEGAD TRIRTDGSTT SEPKRRDETD