Gene Hhal_1216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1216
Symbol
ID	4710406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1320166
End bp	1321239
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	68%
IMG OID	639855689
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_001002793
Protein GI	121998006
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGATC ACGAGCGCGA CCCATCGCAG ATCCTCGAGG AGCTGACGAC CGCCGTCCTG 
CTGGTGGATG ACCGGGTGCG TATCCTCCAC GTCAACCACG CCGCCGAGAC GCTGTTCCGG 
GTCAGTAGCC GACAGGTGGT GGGCCAGACC CTGGGGACGG CACTGCGCGG GGCGGAACTG 
CTCGAAGAGC TCATCCGCCA GACCCAGCGT ACCGGCGGGG CCTACACCCA GCGCGAACGT 
CGCCTTCCGG TCCGCGGCGA TCGCCCGGTG ACCGTCGACT GCACCATCAC CCCGGTCTCC 
GCCAAACGGG TGCTGATCGA GATCGCCGAG GTGGACCGTC ACGCCCGTAT TACCCGCGAA 
CAGCACCTGC TGTCACAGAA TCGTGCCGTA CAGGAGCTGA TCCGCGGACT GGCCCACGAG 
ATCAAGAACC CGCTCGGCGG CCTGCGCGGC GCGGCGCAGT TGCTGGAGGC CGAGCTCCCG 
GAGCGCGACC AGCGCGAGTA CACCCAGGTC ATTATCCGCG AGGCGGACCG CCTGCAGCAG 
CTGGTGGACG CCCTGCTCGG TCCCAATGCG CCGGCCCGTG AGGAGCCGGT CAACATCCAT 
GAGGTCCTCG AGCGCGTCCG TTCGCTGGTC ATCGCCGAGG ATGCCGAAGG CCGCGCAGAG 
GCGCCAGCGG TGGCGCTCCA GCGCGACTAC GATCCGAGCA TCCCGCCGGT CACCGCCGAG 
CACAATCACC TGGTCCAGGC GGTGCTCAAC CTGGTGCGCA ACGCCCGTCA GGCCACCGGG 
CCAGGGGGGA CCATCACCCT GCGTACGCGC ACCCAGCGTC AGTTCACCAT CGCCGACAAG 
CCCCACCGCC TGGTGGCCCG CATCGACATC ATCGACGACG GGCCGGGGAT CCCCCTCGAT 
CAGCAGGAGC AGATCTTCTA TCCGATGGTC ACCTCGCGCC CCGAGGGTAC CGGTTTGGGA 
CTGCCCATTG CGCAGAGCCT GGTCAGCCGC CTCGGTGGCC TGATTGAGTG CGTCAGCGAA 
CCGGGGCGCA CGGTGTTCAC CATCTGGTTA CCCATGGAGA CGGAAAATGA CTGA

Protein sequence

MEDHERDPSQ ILEELTTAVL LVDDRVRILH VNHAAETLFR VSSRQVVGQT LGTALRGAEL 
LEELIRQTQR TGGAYTQRER RLPVRGDRPV TVDCTITPVS AKRVLIEIAE VDRHARITRE 
QHLLSQNRAV QELIRGLAHE IKNPLGGLRG AAQLLEAELP ERDQREYTQV IIREADRLQQ 
LVDALLGPNA PAREEPVNIH EVLERVRSLV IAEDAEGRAE APAVALQRDY DPSIPPVTAE 
HNHLVQAVLN LVRNARQATG PGGTITLRTR TQRQFTIADK PHRLVARIDI IDDGPGIPLD 
QQEQIFYPMV TSRPEGTGLG LPIAQSLVSR LGGLIECVSE PGRTVFTIWL PMETEND