Gene Rcas_4209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4209
Symbol
ID	5541720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5444002
End bp	5445510
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	61%
IMG OID	640896316
Product	TPR repeat-containing CheR-type MCP methyltransferase
Protein accession	YP_001434254
Protein GI	156744125
COG category	[N] Cell motility [T] Signal transduction mechanisms [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1352] Methylase of chemotaxis methyl-accepting proteins [COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.135133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0700485
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACGA ATGGTATGAA TATGGCGCAC GATCTCTTCG TTCCTCCGCC AGTGCGTCTG 
TCGCCGGAGG CGTTCGACCG GCTACGCACC CTGCTGGCAG ATTATAGCGG CGTCTACCTG 
GATACGGCGC AGCAGCGCGT GCTGGAAGCG GGTCTGGCGC AGCGTGTGGC AGCGCTTGGC 
GAGACCCTCG AGTCCTATGA GCGCCACATC AGCGCACCGG CCGGTCGCAA CGAACTCCAC 
CGTCTGGCAG AGATGGTGGT CAACCACGAG ACCTTTTTCT TTCGCAATGC ACCGCAGATG 
CGCGCACTGC GCGAGACATT GCTCTTTGAA TTGCACCGTC GCAAGCCGCC GGGCGAGCCG 
ATCCGCATCT GGAGCGCCGG TTGCGCAACC GGCGAAGAGG CGTATTCCCT GGCGATCACG 
GTGCTGGAAA CGTTCGGTCT GGCACTGATA CGTCCGGTTG AAATCTGGGC AACCGATCTG 
AGCGAACTGG CGCTCGAAAA GGCGCGGACC GGATTCTACC GGGGGCGCTC GCTCAACAAT 
GTGACGCCAA TGCTGCTCAA TCGCTACTTC GTGCGGCACG GCGACGGATT TCTCGTGTCG 
GACGCTGTGC GGGCGCTGGT GCGTTTCGAG CAACTGAATC TCCTCGAAAC GTTTCCGCCG 
ACGGCGTATG GCGTCGACGC AATTTTCTGC CAGAATGTGA CGATCTATTT TCGTCCGGAG 
ACGCGGCGTT CATTGATCGA ACGATTTCAT CGCTGCCTGC CGGTCCACGG GCTGCTCTTC 
CTGGGATTTT CAGAAACGTT GTGGAATGTG TTCGATGGTT TTCGTTCACG CGAAGTATCG 
GGGGCGTATG TCTACCAGAA GGTCAATCCG CCCGACCGAC CGACTCAGCA TCGCAGCACT 
TCACCTCGAC CATCGCTACC AACAGAGACC CGACGACGTT CACCGTCCGT CGTCAAAGTC 
GCATCCACCC CTTCTCGAAA GGCGCGACCG CCTGTTGCTG CGACAACCGC GCCAACTATG 
GAAGAGGATG TCGGTCGTGT GGAACAGGCG CAAGCCCTGA TCGACGCCGG CAGGATCGAC 
GAAGCGATGG ACCTGCTGCG CAGCATTCAC CCCAACTCGT CGCTGGCGCC GCGCGCGCTG 
GTGCTGGTGG CGCGCGTGCA TGCCGATCGC GGCGAACTCG ACCTGGCCAT TGCTGAAGCG 
CGCCGCGCGC TCGAAATCGA TGCATTGCGC AGTGACGCCT ATCTTCTCAT CGGAACGATC 
TATGCCCGCC AGGGTCAGGG AAACGAGGCG ATCCAGGCGC TCGAACGAGC GCGCTACCTG 
GACCCCGACG CCGCGTTGGT TTCCTATCAC CTGGCACTGG CATACCGTCA GGCGGGCAGG 
CAGGAACAGG CGATGCGCGA GTTTCGCAGT GCGCTGAGCA AACTGGCCAG GCACCGGTCC 
GAGGATCTCA TCGAAGGCGT CGAAGTCGGT TGGTTGCGCA CCACATGTGA GCAACACCTG 
GGCATGTAA

Protein sequence

MRTNGMNMAH DLFVPPPVRL SPEAFDRLRT LLADYSGVYL DTAQQRVLEA GLAQRVAALG 
ETLESYERHI SAPAGRNELH RLAEMVVNHE TFFFRNAPQM RALRETLLFE LHRRKPPGEP 
IRIWSAGCAT GEEAYSLAIT VLETFGLALI RPVEIWATDL SELALEKART GFYRGRSLNN 
VTPMLLNRYF VRHGDGFLVS DAVRALVRFE QLNLLETFPP TAYGVDAIFC QNVTIYFRPE 
TRRSLIERFH RCLPVHGLLF LGFSETLWNV FDGFRSREVS GAYVYQKVNP PDRPTQHRST 
SPRPSLPTET RRRSPSVVKV ASTPSRKARP PVAATTAPTM EEDVGRVEQA QALIDAGRID 
EAMDLLRSIH PNSSLAPRAL VLVARVHADR GELDLAIAEA RRALEIDALR SDAYLLIGTI 
YARQGQGNEA IQALERARYL DPDAALVSYH LALAYRQAGR QEQAMREFRS ALSKLARHRS 
EDLIEGVEVG WLRTTCEQHL GM