Gene Cthe_2663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2663
Symbol
ID	4808831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3141839
End bp	3143095
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	42%
IMG OID	640108078
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001039055
Protein GI	125975145
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.457369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAAGA TTAGAAGTAC CAACAGGCCT TTAAGGATAG CCTATTTGAT TTCTGCCGTA 
CTTGCAGTGG GCCACGGTAT ATTTATTTAT ATAATGTCAG GCGGAAGAAC GGCAGCTTTA 
ATTACCAATG TATTGGTGTG CGCACTTGTG GCATTTTCAA TAAAAGTGGC AACTGATATT 
ACATTCAGAA GAATTGTCAA CAGAATCAAT ACGGATATGG AGAAAATAAA CCAGGGAGAT 
CTGTCCCACC TGATTGAAAC TAAAGACACC GGCGAAGTGA AAAAAATATC TGTGGCTGTC 
AATTCCATGT TGCAGGATAT TTGTACATTG ATTGAAAGCT TCCTCTCTCT TTCGTCCCTT 
ATTATGGAAT CCACGGAAAA AGTGAGTGCT GCTGCCGAGT CGGCATCGCA GGCCATGGAG 
GAAATATCGA GAACTGTGGA GCAAATAGCA ACAGGAGCGT CATCCCAGGC AAATGAGGCA 
CAACAAGGTG TACAGGTTAT GGATAAGCTG TCAGAGCAGA TCACACTGGT ATATCAAAAT 
TATAACAGCA TCATAGATGA TACAAGGAAA ATCAGTGAAT TGAACAACAT TGGACTGCAG 
TCGGTCAAAG TGTTGAGGGA CAAGTCCAAA GAGAACTATG AAACGACGGA AAAAATATTT 
TCGGTTGTGG AAAAGCTTGC AGATGGGATA AAGGATATAG GAAACTTTGT TGAGTCCATT 
GAAAATATAG CGGAACAAAC AAACCTGCTG GCACTGAATG CAGCGATAGA GGCGGCAAGG 
GCCGGAGACG CGGGAAAAGG ATTTGCAGTG GTCGCCGATG AAGTCAGAAA GCTTGCGGAT 
CAAAGCAGGA AATCCACGGA AGAGATAAAT TTGTTGGTGA ACAGTATACA GGAAGAATCC 
GTATTGGCGA TAGAGTCCAT GGAAATAATG AGAAAAGTGT CGGCAGAGCA GAGTGAGGCC 
GTCAATCAGA CGGACAATGC TTTCAGTGAT ATTGCAAATG CAATAGATTC CATAGTTTTA 
AGAATTGAAA ATGTAAATCA GGCGGTTGAG AAAATGCAGA ATGACAAGGG AGAAGTAATT 
GCCACGATTG AAAACATTTC AGCGGTTTGT GAGGAAACGG CGGCGTTCAG TAAAGAAGTG 
GCGATGACAA CAGAGCATCA ATTGAAGTAT ATTGATGAGA TGAAGGAGGC TTCAAGCAGC 
CTCAGCGGAC TTGTGAAGGA GCTTGATGCG AAATTGGCAA AGTATAAGAT AAAATAG

Protein sequence

MIKIRSTNRP LRIAYLISAV LAVGHGIFIY IMSGGRTAAL ITNVLVCALV AFSIKVATDI 
TFRRIVNRIN TDMEKINQGD LSHLIETKDT GEVKKISVAV NSMLQDICTL IESFLSLSSL 
IMESTEKVSA AAESASQAME EISRTVEQIA TGASSQANEA QQGVQVMDKL SEQITLVYQN 
YNSIIDDTRK ISELNNIGLQ SVKVLRDKSK ENYETTEKIF SVVEKLADGI KDIGNFVESI 
ENIAEQTNLL ALNAAIEAAR AGDAGKGFAV VADEVRKLAD QSRKSTEEIN LLVNSIQEES 
VLAIESMEIM RKVSAEQSEA VNQTDNAFSD IANAIDSIVL RIENVNQAVE KMQNDKGEVI 
ATIENISAVC EETAAFSKEV AMTTEHQLKY IDEMKEASSS LSGLVKELDA KLAKYKIK