Gene Cphy_3669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3669
Symbol
ID	5742693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4507271
End bp	4509559
Gene Length	2289 bp
Protein Length	762 aa
Translation table	11
GC content	35%
IMG OID	641294779
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001560755
Protein GI	160881787
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000205913
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAAA AGAGCAAAAA GTTATTTGGT AATCTCAGAA AAACAAAAAA GGGAAATGTT 
GATTTTGATG AGACTATGAT GGAACAAATG AAACAAGAAA CAAAGAAAAA ACGAAAAGTA 
AAATTTAAAC GTAACAAAGA TGAGGAGTTT CAAACAGAGG GAACGAAAAA GAAACAAAAA 
TTTAAGAACA AAGAATTAAA GAAGGCGATT AAAGAAGGCA TAGAAAATGA TGTCGATATT 
GTTCCTAGAA AAGTAAGGAA TGGTAAGTTT TTTAGAGTTA TTGCTAGTAT TAGAACGCAA 
ATGCTTATCG GTTTTACTGT ACCGATTTTA TTTGTCATAA TAGTTGGGGC AATATCATAT 
ATAAAAGCTT CGAATGGGTT AGTAAGTGGT TTTGAAGATT CTGCAACAAA AACAATCGGT 
ATGGCGGTGA ACTACATTGA TGTTGGAATG AGCACCCTAG AATCTGAGGC CTTTGTGCAG 
TCTCAAAATG ATAATATTAC AAGTTATATA TTTAGTAGTA AAAACGAAGA ACAAATAAAA 
TTGTATGAGT TGACACAGGC TATTTATGCT CAATTAACAG CTGCACAAGT AGCAAATGAA 
TTCATTCAGG ATATACATAT TATACCAAAA GACCATGCAA AAGTGTTATC TACAAAAACC 
AGGGGAGTAA TAGGGTTTAG TGATGCCATG AAGGATACCG ATGCCGCATC AATGACAGAA 
TCAAAAAATC AAGCTGCTTG GGTTGGTAGT CATGCTATGG TTGATGACGA ATTAAAAACT 
TCCTATAATA ATTATGCTTG CACATTTATC CGACAGTTTA AGTCAAAGAA TGGTTATATC 
GTAATTGACT TAAGTAAGAA AAAAGTAGTT CAACTCTTAC AGGATATTGA ATTAGCAGAA 
GGAAGTTATA TTTCCTTTGT AATGGATGAT GGTAGAGAAA TTTCCGCAAT AAGCGATACT 
ATTGCCTTTA GCGATACTAC TTATTATAAA GAAGGTATGG CTAACAACGA AGGTAACTAT 
AACACATATG TAAAAGTTGA TAAAAAGGAT TACCTCTTTA TGATGGCAAA GAGTAGTTCA 
AAAGGATTCT CTATTTGCGC ATTAGTACCA AAAGCGTCTG TAATGAAAAG TGCTAGTGAC 
ATTAAAGGGG TTACGGTTAG TGTCGTTGCA ATAGCTATCC TTGTTGCAGC ATTCGTGGGT 
GGATTAATAT CCATTATGAT TGGTAAGAGT ATTCATCGTA TTTCGAAAAA ATTAATCAAA 
GTATCTGAGG GTGATTTAAC CATTGATATG GACATCCATA CAAGCAATGA ATTTGGTATG 
CTTGCCGGTA ACGTTAAGGA AATGGTAAAT AACACGAGAG ATCTTATTCA CAAAGTAGTT 
CAGGTTACGA ATTTAGTTAC AGAGGCTACC AAGAGTCTTT CAGCGACATC AAGGGATATG 
ACCGATTCTA GTGAGCACAT TACTACAGCA ATCAATGAGA TAGATATCGG AATTGCACAA 
CAGGCTGAAG AAGCTCAGTT ATGTTGTAAC CAGATGGATG AGCTATCGAA TAAGATGGGT 
ATCGTAAATA ATAATGTTAA CGAGATTCAA ACTCTTGCTG ATCAGACGCA GGTGATGATT 
CAAAATGGTA TCACTACAAT GACCTTGCTA ACAAAACAAT CTCAGACAAC GAATGAAATA 
ACACAACAGG TAATGACTGA TATTAAGGCT CTTCAAAAAC AGTCTGCGTC TATTGAACAA 
TTCATTGGAA TTATTAATGA TATTGCAAGC CAAACAAATC TCTTATCTTT AAATGCTTCT 
ATCGAAGCTG CTAGAGCTGG TGACGCCGGA AGAGGATTTG CAGTAGTTGC TGAAGAAATT 
CGTAAATTAG CAGAAGGTTC TGTAAATGCA GCACAAGAGA TTCAGAAAGT TGTTGTTGAT 
ATTAAAACAA AAACTGAATC AACAGTACAG ACAGCGCAAA AAGCAGAAAC GGAAGTTACT 
TCTCAAGTGA AGTCTGTAGA AACAACTAGG GAAGCATTCC ACAGCATGAG CGAATGTGTA 
GATAGTCTAT TAACAAATCT AAAAGAAGTA ATTGAAAATG TTGAAAATAT GAATGAAGAC 
AGACAAAAGA CTTTAGATTC AATTGAAAGT ATTTCTGCAG TTTATGAGGA AACCGCAGCT 
TCTTCTTCTA TTGTTAATAA CACAGCTCAG ATGCAGTTAG GACTATCCAA AACTCTTGTG 
GAAGGTACGC AAGAATTAGA GCTACGTACG GAAGAGTTAA AAGATGCAAT GCGTAAGTTT 
ACAGTATAA

Protein sequence

MIEKSKKLFG NLRKTKKGNV DFDETMMEQM KQETKKKRKV KFKRNKDEEF QTEGTKKKQK 
FKNKELKKAI KEGIENDVDI VPRKVRNGKF FRVIASIRTQ MLIGFTVPIL FVIIVGAISY 
IKASNGLVSG FEDSATKTIG MAVNYIDVGM STLESEAFVQ SQNDNITSYI FSSKNEEQIK 
LYELTQAIYA QLTAAQVANE FIQDIHIIPK DHAKVLSTKT RGVIGFSDAM KDTDAASMTE 
SKNQAAWVGS HAMVDDELKT SYNNYACTFI RQFKSKNGYI VIDLSKKKVV QLLQDIELAE 
GSYISFVMDD GREISAISDT IAFSDTTYYK EGMANNEGNY NTYVKVDKKD YLFMMAKSSS 
KGFSICALVP KASVMKSASD IKGVTVSVVA IAILVAAFVG GLISIMIGKS IHRISKKLIK 
VSEGDLTIDM DIHTSNEFGM LAGNVKEMVN NTRDLIHKVV QVTNLVTEAT KSLSATSRDM 
TDSSEHITTA INEIDIGIAQ QAEEAQLCCN QMDELSNKMG IVNNNVNEIQ TLADQTQVMI 
QNGITTMTLL TKQSQTTNEI TQQVMTDIKA LQKQSASIEQ FIGIINDIAS QTNLLSLNAS 
IEAARAGDAG RGFAVVAEEI RKLAEGSVNA AQEIQKVVVD IKTKTESTVQ TAQKAETEVT 
SQVKSVETTR EAFHSMSECV DSLLTNLKEV IENVENMNED RQKTLDSIES ISAVYEETAA 
SSSIVNNTAQ MQLGLSKTLV EGTQELELRT EELKDAMRKF TV