Gene RPC_4104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4104
Symbol
ID	3973154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4563437
End bp	4565197
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	67%
IMG OID	637927208
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_533949
Protein GI	90425579
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein [COG4564] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.783692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACA GTTCCGGAAG GTTATGCCGT TACTGTGATG CCGCCCGCCC CGCTGCAGTC 
GCCGGAGACA TCGCCGTGAA ATTCAACAAT CTTACGATCA CCCCGAAACT TGGCATCCTT 
GTGGGGGTGA CGTTGCTCGG CCTATGCGCC GCCGGCGTGC TCGCCGGATC GATGATGCAG 
CGGGAGATGC TGAACGCGCG GATCGAGCAG ACCAAGACGG TGGTCGAGGT GGCGCGCACC 
ATGGCGATCG GTCTGCAGAA GCAGGTCGAT GCCGGTCAGC TCACCAAGGA CGCGGCGATT 
GCCGAATTCG CCAAGCGCGC CAACACGATG ACGTTCGACA ACGGCGCCGG CTATTTCTTC 
GCCTACACCA TGGACGGGAT CACCATCGCG CATTCCGATC CCAAGGCACT CGGCACCTTT 
CGCCTCGACA CCCAGACCAA CGGCCGCGCG ATCTCGCGCG AACTGCGTGA CGGCGTGGCC 
GCCAAGGGCG AGTTCTTGCT GAGCTACGAA TTCATGAAGC CTGGCGAGAA GCAGCCGACC 
CGCAAGCTCG GCTACGCCGT GGCCATTCCC GGCTGGAATA TGTTCGTCGG CACCGGGGCC 
TATCTGGACG ACCTCGACGC CAAGTTGCAG CCGATCATGT GGGCGCTCGG TCTGGCGTTC 
CTGGCCATCG CGGTGTTCGC AGGTTTGATC GCGCTGCTGA TCGGCCGCAG CATCACCGGG 
CCGCTCGGCC AGCTCGGCGC GCGGATGCGC TCATTGGCCG ACGGCCGGCT GGACGACGAC 
ATTCCCGGCA TCGCCCGCGG CGACGAGGTC GGCAAGATGG CCGCCACCGT GCAGGTGTTC 
AAGGACAACG CGATCCGGAT CCGCGGCCTG GAGCAGGTCG AGGCCGAGGC GCAACAGCGC 
GTCGCGGCGG CGCGCCGCGC CGAGATGGAG AGCCTCGCCG ACGATTTCGA GCGCAGCGTT 
TCGGGCATCG TCCGCTCGGT GTCGGCGGCG GCGCAGGGCA TGCAGTCGAC CGCGCAGTCG 
ATGACCGCGA CCGCGACCGA CGCCTCGTCG CGCGCCGCCA CGGTCGGCGC CGCGTCTGAA 
AATGCTTCCA CCAATGTCGG CACCGTGGCC TCGGCCGCCG AAGAACTGTC TGCCTCGGTC 
ACCGAGATCG CCCGCCAGGT CAGCCAGTCG CGCGAGATCG CCAGCCGCGC GGTCGGCGAC 
GCCGAGCAGA CCAACGAGAC CGTGAAGCTG CTGTCGATCG GCGCCGAGAA GATCGGCGAA 
GTGGTGCAGC TGATCCACTC GATCGCATCG CAGACCAATC TGCTGGCGCT GAACGCCACC 
ATCGAAGCCG CCCGCGCCGG CGAGTCCGGC CGCGGCTTTG CCGTGGTGGC CTCCGAAGTC 
AAAGCGCTGG CGAGCCAGAC CGCCAAAGCC ACCGAGGAAA TCTCGACGCA GGTTTCGGCG 
ATGCAGGCCT CGACCTCCGA CGCGGTGAAA TCGATCGGCG GCATCACCGG CACCATTGCG 
CAGATGAGCG AGATCACGCT GGCGATTTCC GGCGCCGTGG AAGAGCAGGG CGCCGCGACC 
CGCGAGATCG CCCGCAACAT CCAGTCGGTC GCGGCGGGCT CCAGCGAGAT CTCCAATCAC 
ATCGGCGGCG TCGCAGCGGC TGCGGAAGCC ACCGGCAGCG CGGCCTCGGA AGTGCTGTCG 
AATGCCCGCG AACTCGACAG CCAGTCCGGC CTGCTGCGCG TCGCGGTCGA CGAGTTCCTC 
GGCAAGGTTC GCGCGGCGTA A

Protein sequence

MSNSSGRLCR YCDAARPAAV AGDIAVKFNN LTITPKLGIL VGVTLLGLCA AGVLAGSMMQ 
REMLNARIEQ TKTVVEVART MAIGLQKQVD AGQLTKDAAI AEFAKRANTM TFDNGAGYFF 
AYTMDGITIA HSDPKALGTF RLDTQTNGRA ISRELRDGVA AKGEFLLSYE FMKPGEKQPT 
RKLGYAVAIP GWNMFVGTGA YLDDLDAKLQ PIMWALGLAF LAIAVFAGLI ALLIGRSITG 
PLGQLGARMR SLADGRLDDD IPGIARGDEV GKMAATVQVF KDNAIRIRGL EQVEAEAQQR 
VAAARRAEME SLADDFERSV SGIVRSVSAA AQGMQSTAQS MTATATDASS RAATVGAASE 
NASTNVGTVA SAAEELSASV TEIARQVSQS REIASRAVGD AEQTNETVKL LSIGAEKIGE 
VVQLIHSIAS QTNLLALNAT IEAARAGESG RGFAVVASEV KALASQTAKA TEEISTQVSA 
MQASTSDAVK SIGGITGTIA QMSEITLAIS GAVEEQGAAT REIARNIQSV AAGSSEISNH 
IGGVAAAAEA TGSAASEVLS NARELDSQSG LLRVAVDEFL GKVRAA