Gene RPB_3522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3522
Symbol
ID	3911324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4030345
End bp	4031760
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	68%
IMG OID	637885424
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_487128
Protein GI	86750632
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.392623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.542302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGGTC CCATGTCGAT TCTATCGGTT GCACGCAAGG CGTTGCGCGA CGGCAGCGAC 
GAAACCTCGA CCGGCGCGGC GACACCGGCC GCTGACCTGG TAAACATACG AGCCCGCGAC 
GACGCGATCG CCGCCTGTCT GCGCCGGATC GCCGAAGGCG ATTACGAGGT CGTGCTGCCG 
GCGGGCGACG ATCCGCTGTC GCAGGCGGTC GGCGCGCTGT TGCAGCGGCT GTCGGGCAAC 
GCCTCCCGCA ATCTCGACCG CATGGTCGAC CTCAGCATCC AGGGCAGCGA GACGGCGATG 
TCGTCCGCTT ATTTGCTGTC GTCGACCCGC GAGATCGACC AGCGCACCCA GGCGCTGGCG 
AGCGCGAGCG AGGAGATGGT GGCGTCGATC GGCCAGATCC GCGCCACCGC CCAGGCCGCT 
GCGACCGAAG CGACCGAGAT GCAGATCAGC GCTGATCGCG GCATGACGAC GGCGAACTCG 
GCCTCCGCCG CGATGGGGCG GGTCAGCACC ACCGCCGAGC TGGCCTCGGC GAAGATCACC 
GCGCTCAGCG AAGCCTCCGA AGCGATCGGC AGCATCGTCG GGTCGATCGA CGCCATCGCC 
CGGCAGACCA ACCTGCTGGC GCTCAACGCC ACCATCGAGG CGGCGCGCGC CGGCGAGGCC 
GGCCGCGGCT TCGCCGTGGT CGCCACCGAG GTCAAGAGCC TGTCGCAGCA GACCTCGAAC 
GCGACCGTCG ACATCCGCAG CCGGATCGAC CGGCTGCGCG AGGACATCGC CACGATCGTC 
GCCGCGATGG CGGACTGCAC CGGCGCCGCG GTCGAAAGCC GCGAGGTGGT CAACACGCTG 
GGCGAAGCGA TGGCCGGCGT GTCCCGGCGC GTCACCGGCG TCACCGACGG CATGTCGGAG 
ATCGCCACCA TCCTCAATCA GCAATCCGAA GCCTCGCGCG AGATCGCGAC CGGCATTTCG 
GCGATCGCCG AGATGACCAA GAACAGCGTC GGCCAGGTCG GCGACATCTC CGACCAGCTC 
GATCACGTGC AGTCGCTGGT CGATAGCGAA TTGTCGGAAC TGTCGCGCAT GACGTTCGAC 
GGTCTGATCG AGCGCCTCGC CAAGGCCGAT CACATCACCT GGAAGAAGAA GCTCTGCGAC 
ATGGCGGTGG GCCGCGCCAA GCTCAACGCC GACGAACTCA CCGACCACCA TTCCTGCCGG 
CTCGGCAAAT GGTACTACGG CGACGGCTCG CTGCAGTCGC GCAACGCCCC GGCCTTCCGG 
GCGCTGGAGA AACCGCACGC GCTGGTGCAC GATCACGGCA AGAAGGCCGC GCGGCTGTTC 
CAGTCGGGCG ACCTCGCCGG CGCGATCGCC GAGATCGAAT GCGTCGGCGA CGCATCCAAG 
GACGTGCTGC GGCTGCTCGA CGACCTGGTC AAGTAA

Protein sequence

MRGPMSILSV ARKALRDGSD ETSTGAATPA ADLVNIRARD DAIAACLRRI AEGDYEVVLP 
AGDDPLSQAV GALLQRLSGN ASRNLDRMVD LSIQGSETAM SSAYLLSSTR EIDQRTQALA 
SASEEMVASI GQIRATAQAA ATEATEMQIS ADRGMTTANS ASAAMGRVST TAELASAKIT 
ALSEASEAIG SIVGSIDAIA RQTNLLALNA TIEAARAGEA GRGFAVVATE VKSLSQQTSN 
ATVDIRSRID RLREDIATIV AAMADCTGAA VESREVVNTL GEAMAGVSRR VTGVTDGMSE 
IATILNQQSE ASREIATGIS AIAEMTKNSV GQVGDISDQL DHVQSLVDSE LSELSRMTFD 
GLIERLAKAD HITWKKKLCD MAVGRAKLNA DELTDHHSCR LGKWYYGDGS LQSRNAPAFR 
ALEKPHALVH DHGKKAARLF QSGDLAGAIA EIECVGDASK DVLRLLDDLV K