Gene Rsph17025_3891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3891
Symbol
ID	5085439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	-
Start bp	789027
End bp	790682
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	67%
IMG OID	640485450
Product	hypothetical protein
Protein accession	YP_001170051
Protein GI	146279893
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.452082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGA ACATCAAGAT CAAGCTGGCC GGTGCCTTCT TCCTGGTCTT CCTGCTCATG 
GGAACCGGCA CGATACTGGG AATCATCGAT CTGCGGCACT CGAACCAGGT GCTCCAGACG 
ATCGTCGAGA AACAGGCCGC GCGCGTCGAG TCAGCGAGCC GGCTGGAGAT CCAGCAGACA 
CAGTTCAACG TCGTCCTGCG GGACTATGTG GTCGCCGAGG ATGAGGCCAA ACGCGCCGCG 
CTCAAGCAGG ACATCGTGCA GATCCGCGCC GACATGAGCG CAAGCATCGA GCGGCTCGAG 
GCGCTGGCCG ACGATGTCGG GATGCCGATG ATCAAGGCCT ATGCCGAGCA GCGCAAGGCC 
GCCGCCGCGA TCAACAACCG CGTGTTCGAG CTTGCCGATG GCGGCGATAC GGCGGCCGCC 
TCGCGCCTGC TTGCCGGCGA GGCGCGTCAG GGAATGGAGA AGCTCGCCGC CAATCTCGAG 
GCCTTCCGCA GCACCTACAG CAACCAGATG GCTGAGGCGA CCGCCTCTGC CAGCCGCGAT 
CTGGCGGCGA GCGTGCTCAA CCTGTCCCTC CTCGCTCTGG CCGGGGTGCT GTTCGGGACA 
ATCGCCGCCA CGCTCGTGAC GGCCTCGATC GCGCGGGGCC TTCAGCGGAC ACTGGACCTG 
ACGCAACGCG TTGCGCACGG TGATCTGACG ACGCTGGCCG ATGACCGGGG CTCGGACGAG 
ATCGCGCAAC TGCTCAAGGC GAGCAACTCG ATGATCCTCC GCCTCCGCGA GGTCGTGGGC 
CGCGTCACGC TTGCGACCAA TCAGGTGGCC GCCAACAGCC GGATCATGGC CTCCACGTCC 
GAGCAGCTGT CGCAGGGCAG CAGCGAACAG GCCTCGTCCA CGGAAGAAGC GTCCGCCTCG 
GTCGAGCAGA TGGCGGCCAA CATCAAGCAG ACGGCGGACA ACTCCGCCCG CACGGAACAG 
ATTGCCATCA AATCGGCCGA GGATGCGCGT GCCTCCGGTG GCGCGGTGCG CGAGGCGGTG 
TCGGCCATGG GTGCGATTGC CGAACGTATC CTCGTGGTGC AGGAGATCGC CCGTCAGACC 
GATCTTCTGG CGCTCAACGC GGCTGTCGAG GCCGCCCGCG CAGGCGAGCA CGGACGCGGC 
TTTGCCGTCG TCGCGGCCGA GGTGCGCAAG CTGGCCGAGC GGAGCCAGTC CGCGGCCGCG 
GAAATCTCGC AGCTTTCGTC GCGGACCTCT GCAGCGGCTT CCACCGCGGG CGAAATGCTC 
GAGCGGCTGG TGCCTGACAT CGAGCGCACC TCCACGCTTG TCTCCTCGAT CTCGGTCGCC 
TCGCGCGAAC TTTCCACGGG GGCACAACAG GTGGCACTGG CGATCCAGCA GCTGGATCAG 
GTGACCCAGC AGAACAGCCA CTCGGCAGAG GCTCTGGCCG AGGGGGCAGG AGAGCTGTCG 
ACCGAAGCCG ACCAGCTCAA GGACGCGGTC GGGTTCTTCC TGATCGACGC GACGCCGGAG 
CGGCCGGCCC GTGATCCTCA GCCCGCGCCG AAGTCCGCCC CGCCGGCCGT GCGCAAGCCT 
GCCCTTCAAG TCGCCGCAAA ACCGAAGGGG TTCCACTTCG ACATCGGGGA GAGCGACATG 
GACGAACTGG ACGCAGCGTT CCAGCGCACC GCCTGA

Protein sequence

MKLNIKIKLA GAFFLVFLLM GTGTILGIID LRHSNQVLQT IVEKQAARVE SASRLEIQQT 
QFNVVLRDYV VAEDEAKRAA LKQDIVQIRA DMSASIERLE ALADDVGMPM IKAYAEQRKA 
AAAINNRVFE LADGGDTAAA SRLLAGEARQ GMEKLAANLE AFRSTYSNQM AEATASASRD 
LAASVLNLSL LALAGVLFGT IAATLVTASI ARGLQRTLDL TQRVAHGDLT TLADDRGSDE 
IAQLLKASNS MILRLREVVG RVTLATNQVA ANSRIMASTS EQLSQGSSEQ ASSTEEASAS 
VEQMAANIKQ TADNSARTEQ IAIKSAEDAR ASGGAVREAV SAMGAIAERI LVVQEIARQT 
DLLALNAAVE AARAGEHGRG FAVVAAEVRK LAERSQSAAA EISQLSSRTS AAASTAGEML 
ERLVPDIERT STLVSSISVA SRELSTGAQQ VALAIQQLDQ VTQQNSHSAE ALAEGAGELS 
TEADQLKDAV GFFLIDATPE RPARDPQPAP KSAPPAVRKP ALQVAAKPKG FHFDIGESDM 
DELDAAFQRT A