Gene Rsph17025_3251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3251
Symbol
ID	5086000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	119423
End bp	121081
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	69%
IMG OID	640484823
Product	hypothetical protein
Protein accession	YP_001169440
Protein GI	146279282
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.367816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.217501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATAA AGATCAAGCT CGCCGCAGCG TTCCTTGCGG TTTTTGTGCT GGCGGGAGCA 
GCTGGTGTGC TCGCCGTGCG CGGGTTCAAC TCGCTCGATG CGCAGCTCGA CGCCATGCTC 
GACGGCACCG TTCACGCGGC GATCCAGGCC GATGCGCTCA ATGCCGCGCA GCTGCGGCTG 
AAGGCGGCGA TCCGCGAGCA TCTCATCAGC CAGGACGCGG CCACCAAGAA GGCCCGCGAA 
GAGGAGATGG CGGTCGCGCG CGCCGAGCAG AAGGAAGCGA TGACGGCGCT CGAGACGGCG 
GCTCTCGCGC CCGCTCAGCG CGCGCTGCTC GATGAATACA GCTCGCTCCG CGAGGTGATC 
TCGAAGGTGA ACAACGAAGC GGTCGAGTTC TCGAGCCGGA ACGATCTGGC CAATGCCAGC 
AGGCTTCTGC TCGCGCCCGA CTATCTGGCG ATGCAGTCCA GGCGGGAAGG GCTGATTGCC 
CAGCTTGTCG AGGCCGAGCA GAAGGAACTT GAGGCGTTGC GTCTGGAGGC GGACCGCCAT 
ACGCGCGAGG CGCGCCAGAT GCTGATCGGC ATGTTCGCTC TGGCCGGTGT GGTCGGCACC 
GCCGCGGCCG TCTGGATCAC GGTCTCGATC AGCCGCGGTC TGCGCAAGGC TCTCGATCTG 
TCGCGGCGCG TGGCCGAGGG CGACCTGACC GAGATGGCCG ATGCCCGCGG CCGTGACGAG 
ATTGCCGAAC TCCTCCGCTC GAACAATCTC ATGGTCGAAA AGCTGCGCGA GGTGGTGGGC 
GGCGTCACGA CCGTGGCGCA GCAGGTCTCG TCCGGCAGCG GCGAGATGGC CTCGACCTCA 
GAGCAACTCA GCCAGGGGGC GAGCGAGCAG GCTTCGGCCA CCGAGGAAGC CTCGGCTTCG 
GTCGAGCAGA TGGCGGCGAA CATCAAGCAG GCCGCCGACA ATGCGAGTCA GACCGAGCGG 
ATGGCGACCA AGGCCGCCGA AGACGCCCGC GCCTCGGGGC AGGCCGTGAC CGAGGCCGTG 
GCCGCCATGC GCTCGATCGC CGACAAGATC CTCGTGGTTC AGGAAATCGC CCGCCAGACG 
GACCTGCTGG CGCTGAACGC CGCGGTCGAG GCCGCGCGGG CGGGCGAGCA TGGCCGCGGG 
TTCGCCGTCG TGGCCTCCGA AGTGCGCAAG CTCGCCGAGC GCAGCCAGAC CGCCGCGGCC 
GAGATCTCGT CGCTTTCGAC GGGCACCGTC CGCGCCGCCA CGGGCGCGGG CGAGATGCTG 
AACCAGCTTG TGCCCGACAT CGAACATACC TCGCGCCTCG TGACCGACAT CTCGGTGGCC 
TCGCGTGAAC TGGCGGCCGG GGCCCAGCAG GTCGCGACGG CGATCCAGCA GCTCGACAAG 
GTGACCCAGC AGAACAGCGC AGCCTCGCAA CAGCTTGCGG GTGGTGCTTC CGAACTGTCG 
GGCCAGGCCG CGCGGCTCGA GGAGACGGTG CGTTTCTTCA CGTTGAACGA GCAGGCGCTG 
GCCAGCGCCC CGGCGCCGCA GCTGCGGGTC GTGCAGGGCG GACGGGTGGA AGCCGCGGCC 
GCGCCGCCCC AGCGCAAGGT GGCCTCGGGG GGCTTCAGTT TCAGCCTCGA CGGCACGGAC 
GATGAGCTGG ACCGCGCCTT CCACCGTCAG GGCCAATAG

Protein sequence

MTIKIKLAAA FLAVFVLAGA AGVLAVRGFN SLDAQLDAML DGTVHAAIQA DALNAAQLRL 
KAAIREHLIS QDAATKKARE EEMAVARAEQ KEAMTALETA ALAPAQRALL DEYSSLREVI 
SKVNNEAVEF SSRNDLANAS RLLLAPDYLA MQSRREGLIA QLVEAEQKEL EALRLEADRH 
TREARQMLIG MFALAGVVGT AAAVWITVSI SRGLRKALDL SRRVAEGDLT EMADARGRDE 
IAELLRSNNL MVEKLREVVG GVTTVAQQVS SGSGEMASTS EQLSQGASEQ ASATEEASAS 
VEQMAANIKQ AADNASQTER MATKAAEDAR ASGQAVTEAV AAMRSIADKI LVVQEIARQT 
DLLALNAAVE AARAGEHGRG FAVVASEVRK LAERSQTAAA EISSLSTGTV RAATGAGEML 
NQLVPDIEHT SRLVTDISVA SRELAAGAQQ VATAIQQLDK VTQQNSAASQ QLAGGASELS 
GQAARLEETV RFFTLNEQAL ASAPAPQLRV VQGGRVEAAA APPQRKVASG GFSFSLDGTD 
DELDRAFHRQ GQ