Gene Hhal_1964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1964
Symbol
ID	4710347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2160677
End bp	2162104
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	71%
IMG OID	639856437
Product	histidine kinase
Protein accession	YP_001003530
Protein GI	121998743
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGCTG GGAGAGATAC GGACCCGACC GGCCCACGCC GGCAGCGGGG GGCAGGAGCT 
GTCGAGCCCC TCACCGTACG GGAGCCCCGT GGGCACGGCC CCCGGGACGG TGGTGGCAGT 
GCCGGCCGTT GGCACCCGGT GCGCCGCCTC CGGGCCCCCC CCACCCCCAC GCCCTACCCC 
GACACCCCGA ATGTGCCTGC GTCATCGGCC AGCGAACAGG AGGCCCTGCA CCTGCTCAGC 
GCCCTCGGCG TGGTGGCGGC CCAGGCGCGG GATCTCGATG AACTGCTTCA GGGCAGCCTG 
GAACGGCTGA TCGAACAGAC CGGTGCCACG GCGGCTGCCG TACGACTCTT CGACGAACAG 
GGCAGCCTGC GCCTGGTCGA GGCAAGCGGG CTCAACGCCG GCTTTATCGA TGCCGAGCGC 
CGCCAGCCGG CGGCGGGCTG CTCCTGCGCC ATCGCCGGGG AACGCGGCAC CGTGCAGTTC 
CGGGGCGACC TGCGCCAGTG CATCCGCCGC AGCGGCTGCA ACCCGCTGCC CAACCGACCC 
CAGCTGGCCA TGCTGGCGGT GCCGATCCTC GATCCCGCGG GCGAGAGGGT GGGCATCTAC 
AACATCTATC TGGAACCGAG CGAGGCCCAG CGCTGGATGC ATCCGCCACG CATGCTGGAG 
TGGATCGGGC ACCAGCTGGG CGCGGCGATC GCCCGGGTCC GCGACGAGTA CCGCAGCCAC 
CAGGGGGCCC TGCAGGAGGA GCGCAACCTC CTCGCCCACG AGCTGCACGA CACGGTTGCC 
CAGGAGGTGG CCACGCTGCG CCTGCGGGTC CGCCAACTGG AGGAGCGGGC ACGCGGCGAT 
GCCGACACCG CGGCCCTGCT CGCCCCGCTG GAGGATCTGC GCACCCGACT CGACCACACC 
AACGACCAGG TCCGCACGGT GATGCAGCAA TTCCGTACCC AGGCCCTGGG TACACCGCTG 
GAGACGGCGC TGAGCCGCCT GGCCAACCGC TTCCGGCGCG ACAGCGGCAT CGAGGTCCGC 
CTGATCCATC GTTGGCCGGA GCTCGCCCTG GGCGAGCGCG AGCAGCTGCA CATCCACCGC 
ATCGTCGAGG AGGCCCTGTC CAACGCCTGG CACCACGGCG GCGCCCGCAA CGTGCGCCTG 
CAGCTCGAGA CCCCCGGCGG GGATCTCTGC CTGCTGATCG AGGACGACGG ATGCGGCTTC 
GTGGTGGACG ATGTACCGGA CTCCGACCCG GCCGAGAGCC GGGGACACGG CCTGCGGGGG 
ATGCGCGAGC GCGCCCGCCA CCTGGGCGCC ATCCTCACCG TGGAGAGCGA TCCCGGCCAG 
GGCACCACCA TCCACTTACG CTTGCCCCAG CCGCAGCGCC TGACCTGGAC CACCAAGAGC 
CTTCACCAGG CGGGGTTCAA CGACCATGCG TATCCTGCTT GTCGATGA

Protein sequence

MYAGRDTDPT GPRRQRGAGA VEPLTVREPR GHGPRDGGGS AGRWHPVRRL RAPPTPTPYP 
DTPNVPASSA SEQEALHLLS ALGVVAAQAR DLDELLQGSL ERLIEQTGAT AAAVRLFDEQ 
GSLRLVEASG LNAGFIDAER RQPAAGCSCA IAGERGTVQF RGDLRQCIRR SGCNPLPNRP 
QLAMLAVPIL DPAGERVGIY NIYLEPSEAQ RWMHPPRMLE WIGHQLGAAI ARVRDEYRSH 
QGALQEERNL LAHELHDTVA QEVATLRLRV RQLEERARGD ADTAALLAPL EDLRTRLDHT 
NDQVRTVMQQ FRTQALGTPL ETALSRLANR FRRDSGIEVR LIHRWPELAL GEREQLHIHR 
IVEEALSNAW HHGGARNVRL QLETPGGDLC LLIEDDGCGF VVDDVPDSDP AESRGHGLRG 
MRERARHLGA ILTVESDPGQ GTTIHLRLPQ PQRLTWTTKS LHQAGFNDHA YPACR