Gene Cphy_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_1035
Symbol
ID	5741871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	1307566
End bp	1309035
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	37%
IMG OID	641292142
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001558154
Protein GI	160879186
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTGA GACGAAGAGG TTCTTGCGCT GAGATGGATG GCATCTTACA GTATGTAGAG 
GATGCTATGG CAGGCAAAGA TTGTGGTTGT TGTCCTTCAA GCAATCATGT GATTCATAGT 
CGGGTAATTA AAGATTTTAA TACCTTGATT GAGAATGAAA AAAGGATGTC AAAGGCGGCA 
AAAGAAGTAT TGGATATTGC AAGTTCCATC AGTAGTTTTG ATGTGGGAAT GTCTTATATT 
TCAACGAAAT TAATGGATTT TGCGACTGAA ATGTCTTCTG TCAGTGAATC CAATCTCGCT 
ATTGTGGAAG AGACGACTGC AACTATGAAT CAAGTAAATG AAACGATTGA TTATACAGCA 
GGTACCTTAG AGAAACTGTC AAATGAATCT GAAATTCTAG CCTCTAAGAA TAATAATAGT 
AAAGAATTAT TAGAAGATGT TACTGCACTA AAAGAAAATG TTATTCTAGA TACTAAGATT 
ATGAACGACA AAATTGAGCA ACTTGTTGTT TTGGCAACTG AGGTTGGTAA GATTGTTGAA 
AGTGTTCAAA CAATTGCAAA TCAAACAAAT TTGTTAGCGT TAAATGCAGC GATAGAAGCA 
GCAAGAGCGG GAGAACAGGG AAAAGGTTTT TCTGTTGTAG CAGAAGAAGT TCGTAAGTTA 
GCGGATGATA CAAAGCATAA CCTGGAAGGA ATGAGAGCTT TCGTAGATGA TATCCACAAT 
GCTTCGAGAG AAGGAAAAGA AAGCATGGAT CGAGCTATGG AATCTACCAG TCAAATGAGT 
GATAAGATTG ATATGGTATC CGAGACGATT GGTGAGAATA TCGAAATGCT CCAGGGTGTT 
GTGTCTAGTG TTGGGGACAT ACATAATTCA ATGCAAGGAA TTAAACTTGC AGCTAATGAG 
ATTAGCAGCG CGATGGAAAC ATCCAGCTCC GATGCGCAAC GTCTTACTGA AATGACACAG 
GAAGTTTCTA AGGATGCTCA GGAGAGTGTA AAATATTCAA AGAGTATCTC TGAAATTGAC 
GATCGACTAT CACATGAAAT AAGAGAAATG TTTGAAGGAT TGAGTACAGG TAATCAAGCA 
GTTACCAATG AAGAGCTTCA ACTTGTGATT GAAAAGGCTG TAAAGGCTCA CTCTGAGTGG 
ATGGTTAATT TAAAGAATAT TGTGGATAAC ATGAAGATAG CACCTATACA AACGAATTCA 
CATAAGTGTG CATTTGGACA TTTCTATCAT GCACTTGTTA TAGATCATGA AGCAATTGAG 
AAGGAATGGA AAGAAATCGA TGGATTCCAT GATCAATTCC ATAGAATGGG AGATAAGGTA 
ATAAAAGCTG TAAAAGCACA AGATAGAAAG ATGGCGAATG ATTTATATAA TGAGGCATCT 
GTTGTTTCTA CTCAGATACT TGGATTACTG CAGAAAGTTC ACCAAAAGAT AGAACAATTA 
AATAAACAAG GAATAAAGAT TTTTGATTAA

Protein sequence

MRLRRRGSCA EMDGILQYVE DAMAGKDCGC CPSSNHVIHS RVIKDFNTLI ENEKRMSKAA 
KEVLDIASSI SSFDVGMSYI STKLMDFATE MSSVSESNLA IVEETTATMN QVNETIDYTA 
GTLEKLSNES EILASKNNNS KELLEDVTAL KENVILDTKI MNDKIEQLVV LATEVGKIVE 
SVQTIANQTN LLALNAAIEA ARAGEQGKGF SVVAEEVRKL ADDTKHNLEG MRAFVDDIHN 
ASREGKESMD RAMESTSQMS DKIDMVSETI GENIEMLQGV VSSVGDIHNS MQGIKLAANE 
ISSAMETSSS DAQRLTEMTQ EVSKDAQESV KYSKSISEID DRLSHEIREM FEGLSTGNQA 
VTNEELQLVI EKAVKAHSEW MVNLKNIVDN MKIAPIQTNS HKCAFGHFYH ALVIDHEAIE 
KEWKEIDGFH DQFHRMGDKV IKAVKAQDRK MANDLYNEAS VVSTQILGLL QKVHQKIEQL 
NKQGIKIFD