Gene RPD_0337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0337
Symbol
ID	4020797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	390010
End bp	391701
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	65%
IMG OID	637960516
Product	chemotaxis sensory transducer
Protein accession	YP_567476
Protein GI	91974817
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.760858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.789667
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCAA AGCTCTCCAT TCGCGCCAAG GTCACGGCGC TTGTCGCGGC CCTTCTGATC 
GCCATGACCG GCCTCGGCGG GCTCGGGATT CTCAAGGTGC GGTCGATGAA CTTTGCGGCG 
CTCGACCTCG CCACCAACTG GCTGCCGAGC ATCAAGGTTC TCGGCGAATT GAGGTTCAAC 
GTCCTCAACT ACCGGACCAT GATCCGCAAT CACATGCTCG ACGTCACCCC CGAAGGCAAA 
GCACGCTTCG AACAGCGTCT GGCGTCGATC GACGCGACCA TCAAGAAGGA CCAAGAGACC 
TATGCGGCGA TGATTGCCTC GCCGGAAGAA CGGCAGCTCT ACGACAGCTG GGTCGTGCAG 
TGGAACGACT ACAAGTCCGT GACCACGAAA ATGCTCGAGA TGTCACGCAA GGACATCGGA 
AAGGTCTCGG CGGAGTCGAC CGACTTCCTG TTCAAGAACC TGAATCCGAT CGGCGTCCGC 
ATGGACGAGA TCCTGCAGAA GGATATCGAC ATGAACGACA AGGGCGCGGA CGGTGCGACC 
GCCTTGGCGG CCTCGACCTA CTCCTCCGCC ATCTACCTGG TCCTGACCAT TCTGGGCGTT 
GCGATGGTCG TCGGCATCGT TGCGAGCGTG ATGGTGATCC GCGACGTGGC GCAGGGCATT 
GCGTCGATCG TCAAGCCGAT GCAGTCGCTC GGTCAGGGCG ACCTCTCGGC GGACGTGCCG 
CATCGCGGCG AGAAGACCGA AGTCGGCTCG ATGGCGGATG CGCTGCAGAT CTTCAAGGAC 
GCGCTGATCG CCAAGAAGGC CGCTGACGAG GACGCGGCGC GTGAAGCTGA GGCGAAGATC 
GCGCGCGGCC AACGCATCGA TGCAGCGACC CGCCAGTTCG AAACCTCGAT CGGCGAAATC 
GTCGAGACGG TGTCTTCGGC GTCGACCGAA CTGGAGGCGT CGGCCGGCAC GCTGACCGCC 
ACGGCGGGAC ACGCCCAGGA ACTGACCACC GCGGTCGCGG CGGCCTCGGA AGAAGCCTCG 
ACCAATGTGC AGTCGGTGGC CTCGGCGACC GAAGAGATGT CGTCCTCGAT CACCGAGATC 
AGCCGTCAGG TTCAGGAATC GGCGCGGATC GCCACCGAGG CGGTCGACCA GGCGCGCAAG 
ACCAACGACA GCGTCGGGAT GCTGTCAGCC GCCGCGGCGC GGATCGGCGA CGTCGTCGAA 
CTGATCAACA CCATCGCCGG CCAGACCAAT CTGCTGGCGC TGAACGCCAC GATCGAGGCG 
GCTCGCGCCG GCGAAGCGGG GCGCGGCTTC GCGGTGGTGG CGAGCGAGGT CAAGGCGCTC 
GCCGAGCAGA CCGCCAAGGC GACCGGCGAG ATCGGCCAGC AGATCACCGG CATTCAGGCG 
GCGACCGATC AGTCGGTCTC GGCGATCAAG GAGATCGGCC AGACCATCGG CCGGATGTCG 
GAAATCGCCT CGACCATCGC CTCGGCGGTG GAAGAGCAGG GCGCGGCGAC GCAGGAGATT 
TCGCGCAACG TGCAGCAGGC CGCGCAGGGC ACGCAGCAGG TTTCCGCCAA CATCACCGAC 
GTCCAGCGCG GCGCGACCGA AACCGGCTCG GCGTCGACGC AGGTTCTGTC CGCCGCGAAA 
TCGCTGTCAC AGGACAGCAA CCGGCTGAAG GAAGAGGTCG CTAGGTTCCT CGAAACCGTT 
CGCGCCGCCT GA

Protein sequence

MFAKLSIRAK VTALVAALLI AMTGLGGLGI LKVRSMNFAA LDLATNWLPS IKVLGELRFN 
VLNYRTMIRN HMLDVTPEGK ARFEQRLASI DATIKKDQET YAAMIASPEE RQLYDSWVVQ 
WNDYKSVTTK MLEMSRKDIG KVSAESTDFL FKNLNPIGVR MDEILQKDID MNDKGADGAT 
ALAASTYSSA IYLVLTILGV AMVVGIVASV MVIRDVAQGI ASIVKPMQSL GQGDLSADVP 
HRGEKTEVGS MADALQIFKD ALIAKKAADE DAAREAEAKI ARGQRIDAAT RQFETSIGEI 
VETVSSASTE LEASAGTLTA TAGHAQELTT AVAAASEEAS TNVQSVASAT EEMSSSITEI 
SRQVQESARI ATEAVDQARK TNDSVGMLSA AAARIGDVVE LINTIAGQTN LLALNATIEA 
ARAGEAGRGF AVVASEVKAL AEQTAKATGE IGQQITGIQA ATDQSVSAIK EIGQTIGRMS 
EIASTIASAV EEQGAATQEI SRNVQQAAQG TQQVSANITD VQRGATETGS ASTQVLSAAK 
SLSQDSNRLK EEVARFLETV RAA