Gene RPB_3152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3152
Symbol
ID	3910953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3605826
End bp	3607247
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	68%
IMG OID	637885054
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_486759
Protein GI	86750263
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.285761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCA AACGATTCTC AAATTCAACT CTCGCGCCAT GGCTGCTCGG CGCCACCCTG 
CTGCTGTTCA TCGTCATCGC CGGTGCGTTG ATCCTGAATC TGATGCGGCT GCGCGACAGC 
TTCTCCTGGG TGCAGCACAC CAACGACGCC CTGCTGGCGA TTTCAGGCAT CCAGCGCGAA 
GTGCTGGAAG CCGAGACCAA CGAGCGCGGC TATCTGCTCA CCGGCATCGA CAGCTACCGC 
GAGAATTACA ACCATACGCG GGACACACTG GCATCGCGGC TCGACAGCCT GCGCTCGATC 
GTCACCGACA ACCCCGAACA TGTCGCCCGG GTCGACGATC TCCGCCAGTT GATCGACATG 
CGGACGGCCC AGCTCGGGCG GGTCATCGAA CTGGGGCCGG AGCGTGTGCG CGAGGCCCTC 
GACATTCTCG AGCAGGCCCG CACCGACCGG CTGACCGAAC GCGTCGAAGC CAGCCTGAGC 
GCCCTCACCC GTGTCGAACA AGCCCTGCTG ACGGAGCGCA TGTCGCGGCA CGATCACGAG 
AGCCTCGCGG CGGCGCTGAT CACCGCCTGC CTGCTGATCC TCGCCGTCGC CAGCGCCGCG 
ATCGCCGCAT TTCTGCTCGA GCACCAGCGC GCCGCGGCGC GGCAGCAGGA GGCGGACCAG 
CGGCTGCAGA GCCTGCAGGC CGAATTGATG CGCGTGGCGC GGCTCAGCAC CATGGGCGAG 
ATGTCGAGCG CGCTGGCGCA CGAGCTCAAC CAGCCGCTCG GCGCGATCAC CAACTACGTG 
CAGGGCTCGC GCCGGCTGGT CGAGGCCAGC AGCCATCCCG ACAAGGCGAA GATCGGCGCC 
GCGCTCGACA AGGCCGCGCA GCAGACGCTG CGCGCCGGTG CGGTGATCCA GCGACTGCGC 
GAATTCGTCG GCCGCGGCGA GACCGACAAG ACGGTCGAGA GCCTGCGCGC GATCGCCGAG 
GACGCGCTGG CGCTCGCCTC CGTGGTCACG CGCGACCGCC CGGTCGACGT CGCGCTGACG 
CTCGATCCCG CGGTCGATCG CGTGCTGGTC GACAAGGTGC AGGTGCAGCA GGTCTTCCTC 
AACCTGTTCC GCAACGCCTT CGAGGCGATG CACGAACTCC CGGAACGGCT GCTCTCCATC 
ACCAGCCGGG CCGTCGAGGA CGGCATGATC GAGGTCGTGG TCGCCGATTC CGGTCCGGGT 
CTCGATCCGC AGATCGCCGA CCGGATGTTC CAGCCGTTCG AGACCACCAA AGCGGAAGGC 
ATGGGGATCG GCCTGTCGAT CTCGCAGACC ATCATCCAGG CTCATGGCGG CTCGATCAAC 
GCCGAGCCCG CCCCAGCCGG CGGCACGATG TTCCGTTTCA CTTTGCCCTG CGCCGATCCC 
GGCGCACACG AGCCCCGCCC CGCCGCCGTC TCGGTGTTGT GA

Protein sequence

MTRKRFSNST LAPWLLGATL LLFIVIAGAL ILNLMRLRDS FSWVQHTNDA LLAISGIQRE 
VLEAETNERG YLLTGIDSYR ENYNHTRDTL ASRLDSLRSI VTDNPEHVAR VDDLRQLIDM 
RTAQLGRVIE LGPERVREAL DILEQARTDR LTERVEASLS ALTRVEQALL TERMSRHDHE 
SLAAALITAC LLILAVASAA IAAFLLEHQR AAARQQEADQ RLQSLQAELM RVARLSTMGE 
MSSALAHELN QPLGAITNYV QGSRRLVEAS SHPDKAKIGA ALDKAAQQTL RAGAVIQRLR 
EFVGRGETDK TVESLRAIAE DALALASVVT RDRPVDVALT LDPAVDRVLV DKVQVQQVFL 
NLFRNAFEAM HELPERLLSI TSRAVEDGMI EVVVADSGPG LDPQIADRMF QPFETTKAEG 
MGIGLSISQT IIQAHGGSIN AEPAPAGGTM FRFTLPCADP GAHEPRPAAV SVL