Gene RPD_0994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0994
Symbol
ID	4021469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1120290
End bp	1122260
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	65%
IMG OID	637961185
Product	chemotaxis sensory transducer
Protein accession	YP_568133
Protein GI	91975474
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.357708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTTCC GCCTCCGCCT CAGCCACAAG ATCAACTCCA TCGCCGTCGT CGGCATCGCC 
GGCGTTCTCG CCCTGGGCGC GCTATTCACG TTCGGCAACG CGTCACAGGA CGCAGCGCGG 
ATCGAGGACG AACGTGCAAG GGCGCTCGGT GACAGCAACG CGAAGCTTCA GATCGCGATG 
CTGGAGCAGC GCCGCGCTGA AAAGAATTTC ATCATCCGCA AGGAAGAGAG CTACCTCCGC 
CAGTACCAGG ACAACGCCAA GGCGGCGAAG GCAATTCTCG CCGACATGAC CCAGCGCGCC 
GAAGCAGCCG GGCAGACGGA CCTGAGCGGC AAGATGAAGA CCATCCAGGC GGGCTACGAA 
GACTATGACC GCCATTTTGC GCAACTCGCC GACGCCCAGA TCAAGCTCGG CCTGAAAGAA 
GATCTCGGGC TGGAGGGCAA CATACGCACT TTGGCGAAAA CAATCGAGAC CGCGCTCAGC 
ACACTCGACG AACAGAAGCT GATGGTGACG ATGTTGATGA TACGGCGGCA CGAGAAGGAC 
TTCATGCTGC GCGGCAATCC GCAGTACCTC GACGACATGA AGAAGCGCAT CGAGGAATTC 
TCCGCGCAAC TCGCCGCCGC CGATCTTCCC ACCGCTTCGA AGACCGACAT CGGCCGGCAG 
CTCGCCGTCT ATCAACGCGA CTTCAAGGGA TGGATGGAAA CCGGGCAGGT CATGGTCCAG 
GAGGAAAAAA ACCTCGTGTC CCGCTTCCGC GCGATCGAGC CGGTGCTCCA AAGCGTCGGA 
GCGACTATCA ATCAGTCCGC GGAACAGGCG AAGGCTGCAG CCGCCGCGGC GCGCGAGACG 
ACGACGTCGC GGATGCAGAT CGCGATCGCG CTGATCATCC TCAGCGTCAG CCTGCTCGGC 
CTGTTGATCG GCCGTTCGGT GGCGCGCCCG CTGAAAGGCT TGACTTCCGG GCTCAGAGAA 
CTCGGCGCCG GCAATTTCGA CGTGGTACTG CCCGGCCTCG ACCGTCACGA CGAGATCGGC 
GACATGGCGC AGGCGGTGGA ATCCTTCAAA GTGATGGCGC AGGACAGGGC CCGTGCCGAG 
GCCGAGGCCA AGGCTCAGCA GGAACACCTC GCCGCCGAAC AGCGCAAGCG CGACATGAAC 
AAGCTGGCGG ATCAGTTCGA GGAGGCGGTC GGGGAGATCG TCGAGACCGT CTCGTCCGCC 
TCGACTGAAC TCGAAGCATC GGCGACGACG CTGACCGACA CAGCGCAGCA CGCGCAGCAG 
TTCACCACGC TCGTCGCAGC AGCGTCGGAG GAAGCCTCGA CCAATGTGGA GTCGGTGGCG 
TCCGCCAGCG AGGAGATGGC ATCGTCGGTC ACCGAGATCA GCCGCCAGGT GCAGGAGTCC 
GCGCGGATCG CCAGCGAAGC GGTGACGCAG GCGCAGGAGA CCAACGATCG CGTCAGCCAC 
CTGTCGGAGG CTGCCTCGCG GATCGGCGAC GTCGTTGATT TGATCAACAC CATCGCCTCC 
CAGACCAACC TTCTGGCGCT GAATGCGACC ATCGAGGCTG CGCGCGCCGG CGACGCCGGG 
CGCGGCTTCG CTGTGGTGGC GAGCGAGGTC AAGGCGCTGG CTGAGCAGAC CGCGAAGGCG 
ACCGAACAGA TCAGCCAGCA GGTCGGCGGC ATCCAGTCCG CGACCGGCCA GTCGGTGGCG 
TCGATCCGCG AGATCAGCGG CACGATTGCG CGGATGTCGG AGATCGCCGC GACGATCGCC 
TCCGCGGTCG AGGAGCAGGG CGCCGCGACC AAGGAAATCT CACGCAACGT TCACCACGCA 
GCCGCCGGCA CCCATGAGGT TTCGGTCAAC ATCGTCGAAG TGCAGCGCGG CGCGAGCGAG 
ACCGGTTCGG CGTCTGCGCA GGTGCTGACG GCGGCGCATT CGCTGGCCCA CGACAGCGCA 
CGCCTGAAGG ACGAAGTCAG CCGCTTCCTG CGCACGGTGC GCGCCAGTTG A

Protein sequence

MPFRLRLSHK INSIAVVGIA GVLALGALFT FGNASQDAAR IEDERARALG DSNAKLQIAM 
LEQRRAEKNF IIRKEESYLR QYQDNAKAAK AILADMTQRA EAAGQTDLSG KMKTIQAGYE 
DYDRHFAQLA DAQIKLGLKE DLGLEGNIRT LAKTIETALS TLDEQKLMVT MLMIRRHEKD 
FMLRGNPQYL DDMKKRIEEF SAQLAAADLP TASKTDIGRQ LAVYQRDFKG WMETGQVMVQ 
EEKNLVSRFR AIEPVLQSVG ATINQSAEQA KAAAAAARET TTSRMQIAIA LIILSVSLLG 
LLIGRSVARP LKGLTSGLRE LGAGNFDVVL PGLDRHDEIG DMAQAVESFK VMAQDRARAE 
AEAKAQQEHL AAEQRKRDMN KLADQFEEAV GEIVETVSSA STELEASATT LTDTAQHAQQ 
FTTLVAAASE EASTNVESVA SASEEMASSV TEISRQVQES ARIASEAVTQ AQETNDRVSH 
LSEAASRIGD VVDLINTIAS QTNLLALNAT IEAARAGDAG RGFAVVASEV KALAEQTAKA 
TEQISQQVGG IQSATGQSVA SIREISGTIA RMSEIAATIA SAVEEQGAAT KEISRNVHHA 
AAGTHEVSVN IVEVQRGASE TGSASAQVLT AAHSLAHDSA RLKDEVSRFL RTVRAS