Gene Rpal_5172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5172
Symbol
ID	6412872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5575300
End bp	5577270
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	65%
IMG OID	642715062
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001994135
Protein GI	192293530
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCTTC GTCTCGGCCT CACGTCCAAG ATCAATTCCA TCGCTCTGGT CGGCATCATC 
GGCGTTCTCG CCTTTGGCGC GCTGTACTTG ATCGGGACAT CTTCACAGGA TGCAGCGAGG 
CTGATCGACG ACCGTGCCCG CGCACTCGGC GATAGCAACG CGAAATTGCA GATCGCAATG 
CTCGAGCAAC GCCGCGCCGA GAAGAACTTC ATGCTGCGTA AGGACGAGCA GTATCTCGGC 
ATGTTTCAGC AGAGCGGCCG GGTCGCAACC GAGATGCTCG CCGATATGAT CCGGCAGACC 
GAGGCGACCG GTCAGACTGA CCTCACGCGC AGTTTGAAGT CGGTGCAAGA TGGCTTCGAG 
AACTACCAAA GCCAATTCGG CAGGTTCGCC GAGGCCACCG TGAAGCTCGG GCTCAAGGAG 
GACCTTGGAC TCGAAGGCAG CCTGCGAGCT TCGGTACACG GTGTCGAAAA ATCGATCAGC 
AGCTTCGACG CGCCGGCCCT GATGGTCCAG ATGCTGATGA TGCGCCGGCA CGAGAAGGAC 
TTCATGCTCC GCCGTCATCC GAAATACGGC GAGGCGATGA AGAAGCAATC CGCCGAATTC 
GCCAAGCTGC TCGCCGCATC GGATCTGCCG CAGACGGCCA AGACCGAGAT CACGCAAAAG 
CTCGACGCCT ATCAGCGCGA TTTCTCAGCC TGGATGGAGA ATGCGCTGGC GCTTGATCGT 
GCCGAGAAAG ACATGGTGAC GACGTATCGG GCGCTGCAGC CCGCGCTCGA CGAGCTCTCC 
AGCACGGTGC GGCAGCAGGC GGACCTCGCA AAGACGATGG CCGCTACCGC GCGGCAGGCC 
ACCGAGCAGC GCATGCAGAT CGCGATCATC GCCATCATCC TGACCGTGAT GGTGCTCGGC 
ATCTCGATCG CGCGGTCGAT CACCAGGCCG CTCAGCGGGC TGAACGCCGG CATCCGCCGC 
CTCGGCGACG GCGAACTCGA CCTGGTGCTC CCGGGTCTGC AACGAACCGA CGAGATCGGC 
GACATGGCGC GCGCGGTGGA GTCCTGCAAG CTGAAGGCCG AGGAGCGCGC CGCAGCAGAA 
GCCGCCGCCA AGGCGGATCA GGACCGGCTG GCCGCGCAGC AGCGCAAGGG CGAGATGATC 
GCGCTCGCCG CCAAATTCGA AGACGCGGTC GGCGAGATCG TCGAGACCGT GTCATCGGCC 
TCGACCGAGC TGGAAGCGTC GGCAACCACC CTGACCTCGA CCGCCGATCA CGCCCAGCAG 
TTCACCACCC TGGTCGCGGC CGCCTCCGAG GAGGCGTCCA CCAATGTGCA GTCGGTGGCA 
TCGGCCAGCG AAGAGATGGC ATCCTCGGTC AACGAGATCA GCCGCCAGGT CCAGGAGTCG 
GCGCGGATCG CCAGCGAAGC GGTCACGCAA GCACAGGTCA CCAACGAGCG CGTCAGCCAC 
CTGTCCGAAG CCGCATCGCG GATCGGCGAC GTGGTCGAAC TGATCAACAC CATCGCGGCG 
CAAACCAACC TGCTGGCGCT GAACGCCACG ATCGAAGCAG CGCGCGCTGG CGAAGCCGGC 
CGCGGCTTCG CCGTGGTGGC GGCGGAGGTG AAGCAGCTCG CCGAACAGAC CGCCAAAGCC 
ACCGACCAGA TCAGCCAGCA GGTCGGCGGC ATCCAGAGCG CCACCGACCA GTCGGTGAGC 
GCGATCCGGC AGATCGGCGA AACCATCGCG CGGATGTCGG AGATCGCCGC GACCATCGCG 
TCCGCGGTGG AAGAACAGGG CGCCGCGACC CAGGAGATCT CACGCAACGT CCACCATGCC 
GCCGAAGGTG CGCACCAGGT CTCGGTGAAC ATTGTCGAGG TCCAGCGCGG CGCCTCGGCG 
ACCGGCTCGG CATCGGCGCA GGTGCTGTCC GCGGCGCAGT CGCTGGCGCA CGACAGCACC 
CGGCTGAAGG ACGAAGTCGG CCGCTTCCTC CGAACAGTGC GGGCAGCGTA G

Protein sequence

MSLRLGLTSK INSIALVGII GVLAFGALYL IGTSSQDAAR LIDDRARALG DSNAKLQIAM 
LEQRRAEKNF MLRKDEQYLG MFQQSGRVAT EMLADMIRQT EATGQTDLTR SLKSVQDGFE 
NYQSQFGRFA EATVKLGLKE DLGLEGSLRA SVHGVEKSIS SFDAPALMVQ MLMMRRHEKD 
FMLRRHPKYG EAMKKQSAEF AKLLAASDLP QTAKTEITQK LDAYQRDFSA WMENALALDR 
AEKDMVTTYR ALQPALDELS STVRQQADLA KTMAATARQA TEQRMQIAII AIILTVMVLG 
ISIARSITRP LSGLNAGIRR LGDGELDLVL PGLQRTDEIG DMARAVESCK LKAEERAAAE 
AAAKADQDRL AAQQRKGEMI ALAAKFEDAV GEIVETVSSA STELEASATT LTSTADHAQQ 
FTTLVAAASE EASTNVQSVA SASEEMASSV NEISRQVQES ARIASEAVTQ AQVTNERVSH 
LSEAASRIGD VVELINTIAA QTNLLALNAT IEAARAGEAG RGFAVVAAEV KQLAEQTAKA 
TDQISQQVGG IQSATDQSVS AIRQIGETIA RMSEIAATIA SAVEEQGAAT QEISRNVHHA 
AEGAHQVSVN IVEVQRGASA TGSASAQVLS AAQSLAHDST RLKDEVGRFL RTVRAA