Gene Rsph17029_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1251
Symbol
ID	4896176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1297860
End bp	1299293
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	72%
IMG OID	640111837
Product	histidine kinase
Protein accession	YP_001043133
Protein GI	126462019
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0537245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGTG ACGACGACGG CCTCGAACGG CAGGTCGAGA AGCTGAAGCG GATCAATGCG 
GCCCTCGTCG AGCGGCTGGA TCGCGCGGAT GCCTCGCGCG GCTCGCACTG GATGCTGTTC 
CAGACCGCGA CCGTGCTCGA GCAGGAGCTG CTGGCGCGCA ACCGCGATCT GGAACAGGCG 
CTCGCCCATC TGGAATCGGT GAACCGCGAA CTGGCCCTCG CGCGCGAGAC GGCGGACGAG 
GCGAACCGCT CGAAGAGCCG TTTCCTGCGC GCTGCAAGCC ACGATCTGCT GCAACCCCTG 
AGTGCCGCCA AGCTCTTCCT GTCGCATCTG TCCGAGACGG TGAACGAACC GCTGCAGGCC 
GATCTGGTCT CGCGGATCGG CACGGCCTTC GATTCGACCG AAGAGCTGAT CCGCGCGCTG 
CTCGAGATCT CGCGGCTCGA TTCCGTCAGG CTCGACATCT CGACCGAGCG GGTCTCGCTG 
GGCCGGCTCT TCCAGCGGCT GATGGTGGAT TTCCACGGCG ACGCCGCAGC CCGCGGGCTG 
GAACTGCGCT TCGTCAACTC CTCGGCCACG GTCATGTCGA ACCCGGTCTT CCTGCGCCGG 
ATCGCCCAGA ACCTCGTCTC GAACGCGATC AAATACACGC GGACGGGCCG GGTGCTCGTC 
GGCGCCCGGC GCGAGGGGGC GGATGTCTGG CTCGAGGTGC ATGACACGGG CCCCGGCATC 
GCGCCCGAGG ACCGCGAGCG GATCTTCAAC GAATTCGAGC GGCTGGCGCC CGAAGGCGAG 
GAACCGGGCA CGGGCCTCGG CCTCTCCATC GTGCGGCGCG CCTGCCTGCG GCTCGGCCAC 
GAGGTCGCGC TGGACAGCGC ACCGGGGCGC GGCTCGGTCT TCCGCATCCG GCTGCCGCGC 
GCGCTCGAGG CGCCGGGGGC GATCGAGGCG GGACCGGCCT CGGCGGCCAC CACCGGCGCG 
GTCCAGCGTC TGGCCGGAGC GTCGCCCGAA CGGATGCTGA TGGCCGATCC GGTTGCGGCG 
GGCCCTGCGG CCGCGCCCCT CGTGGGTCGG CGGGTACTGG TGGTCGAGAA CGATGCGGCG 
ATGCGCGACG CCTATGCGCT CCTCCTCCGG CGCTGGGGGA TGCTGGTCGC CACGGCCGAT 
GGCACTCAAG CGGCGCTCGA CAGGCTCGGG AGCTTCCTGC CCGAGCTTCT GGTGACCGAC 
TATAGGCTCG ACCGCGGGGA GACCGGCCTT CAGACCATCG CGGCGCTGCG CCGCCGTCTG 
GGTCCGCGCC TGCCCGCGCT GATCGTGACG GCCGAGCCCG CCGCCCAGCT CGAAGCACAG 
GCCGACCGGC TGGAGGCCGC GCTGCTGCGC AAGCCGGTGT CCGAGAGCGC GCTGCGCGAG 
CGGCTCGCGG CGCTTCTGGA GGGCCGCCGC CGGGGAGCGG CCGCCGCGGA ATGA

Protein sequence

MLRDDDGLER QVEKLKRINA ALVERLDRAD ASRGSHWMLF QTATVLEQEL LARNRDLEQA 
LAHLESVNRE LALARETADE ANRSKSRFLR AASHDLLQPL SAAKLFLSHL SETVNEPLQA 
DLVSRIGTAF DSTEELIRAL LEISRLDSVR LDISTERVSL GRLFQRLMVD FHGDAAARGL 
ELRFVNSSAT VMSNPVFLRR IAQNLVSNAI KYTRTGRVLV GARREGADVW LEVHDTGPGI 
APEDRERIFN EFERLAPEGE EPGTGLGLSI VRRACLRLGH EVALDSAPGR GSVFRIRLPR 
ALEAPGAIEA GPASAATTGA VQRLAGASPE RMLMADPVAA GPAAAPLVGR RVLVVENDAA 
MRDAYALLLR RWGMLVATAD GTQAALDRLG SFLPELLVTD YRLDRGETGL QTIAALRRRL 
GPRLPALIVT AEPAAQLEAQ ADRLEAALLR KPVSESALRE RLAALLEGRR RGAAAAE