Gene RPC_4052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4052
Symbol
ID	3969301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4502453
End bp	4503994
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	62%
IMG OID	637927156
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_533897
Protein GI	90425527
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGATA GAAAACAACC CTCCCTTGAT GAACGGTCGC GTAGTGAACG CCTGCAGTTC 
GGCATTGAGG AATCCGGCAT CGGGGTGTGG GAACTCAACC TGGCGACCCG GCAACTGAGC 
TGGTCGAAGA CCGCCCGGGA CCTGTTTGGA TTCTCCGGCG ACAAGCCGAT CAGCTACGAT 
ATTTTCCTGT CCTTGCTGAC GCCTGAGGAT CGCGCCCGCA CCGTACTGGC GCTGAAACAG 
TCGGTTGATA GCGGCGACAA TTTCGACGTC GAATACCGGA TCGAGCGACG GCCGGGATCG 
GGAACCTGCC ATTGGGTCCG GGCTCGGGGC GGCGTGGTGA AGGCTGAGGA CGGCACGCCG 
CGCCATCTGT GCGGCATCAT CCTCGACATC GACGACCAGA AGCAGCTCGA AGAGGCGCTG 
CGAACCCAGC AGAGCCAGCT GCGCTCGATC CTCGACACCG TGCCCGACGC CATGATCGTC 
ATCGACGGTC ACGGCATCAT GCGCTTCTTC TCCAGCGCGG CCGAGCGGCT GTTCGGCTAT 
TCGGAAGGCG AGGCGATCGG CCGCAACGTC AGCGAACTGA TGGCGGGGCC GGATCGGGCG 
CGTCACGACA ACCATCTCGA CCGTTACCGC GCCTCCGGCG AACGGCACAT CATCGGAATC 
GGCCGAATCG TCACCGGCAG GCGCCGCGAC GGCACCACCT TTCCGATCCA TCTGACGATC 
GGCGAGATGC GCTCCGGGGG CGAACCTCAC TTCACGGGCT TCATCCGCGA CCTCACGGAA 
TATCAGCAAA CCCAGGCCCG GCTCCATGAG CTGCAATCTG AACTGGTGCA CGTCTCCCGG 
TTGAGCGCCA TGGGCGAAAT GGCGTCGGCC CTGGCCCATG AACTCAACCA GCCGTTGTCC 
GCGATCAGCA ATTACATGAA AGGCTCGCGC CGGCTGCTAA GCGGTAGTAA CGATCCCAAT 
CGGCCGAAGA TCGAAGCCGC CATGGACCGC GCTGCCGAAC AGGCGCTCCG TGCCGGCCAG 
ATCATCCGCC GACTGCGCGA TTTCGTGTCG CGGGGGGAGT CGGAAAAGCG CGTGGAGAGC 
CTTGCCAAAT TGATCGAAGA AGCCGGCGCG CTGGGCCTCA CCGGCGCCCG CGAACAGGGG 
GTGTTGCTGC GTTTCAACCT TGATCGGCAA AGCGACATGG TGCTGGTCGA CCGGGTCCAG 
ATCCAGCAAG TCTTGGTGAA CCTGTTTCGC AACGCCGTGG AAGCTATGGC GCATTCTGAC 
AAGAGAGAGC TGGTTGTGGC AAACAACAGG GTCGCCGATC ACATGATCGA AGTCGCGGTT 
TCGGATACCG GCAGCGGATT TCACGACGAC GTCAAGTCCA ACCTGTTCCA AACCTTTTTC 
ACCACCAAGG AAACCGGAAT GGGAGTCGGA CTGTCGATCA GCCGTTCGAT CATCGAGGCC 
CATGGCGGGC GGATGTGGGC CGAGACCAAT TCCGCAGGCG GCGCCACCTT CCGTTTCACG 
CTTCCCGCCG CAGCCAGTGA GGATCTCGCC GATGCCACCT AG

Protein sequence

MTDRKQPSLD ERSRSERLQF GIEESGIGVW ELNLATRQLS WSKTARDLFG FSGDKPISYD 
IFLSLLTPED RARTVLALKQ SVDSGDNFDV EYRIERRPGS GTCHWVRARG GVVKAEDGTP 
RHLCGIILDI DDQKQLEEAL RTQQSQLRSI LDTVPDAMIV IDGHGIMRFF SSAAERLFGY 
SEGEAIGRNV SELMAGPDRA RHDNHLDRYR ASGERHIIGI GRIVTGRRRD GTTFPIHLTI 
GEMRSGGEPH FTGFIRDLTE YQQTQARLHE LQSELVHVSR LSAMGEMASA LAHELNQPLS 
AISNYMKGSR RLLSGSNDPN RPKIEAAMDR AAEQALRAGQ IIRRLRDFVS RGESEKRVES 
LAKLIEEAGA LGLTGAREQG VLLRFNLDRQ SDMVLVDRVQ IQQVLVNLFR NAVEAMAHSD 
KRELVVANNR VADHMIEVAV SDTGSGFHDD VKSNLFQTFF TTKETGMGVG LSISRSIIEA 
HGGRMWAETN SAGGATFRFT LPAAASEDLA DAT