Gene Ccel_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2100
Symbol
ID	7310801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2456773
End bp	2458803
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	33%
IMG OID	643609034
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_002506425
Protein GI	220929516
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTAA CAAAAATATG CAGAAAAATA AAAAATACAA ATATAAGACT TCGCATACAA 
CTGCTTATAG TACTTATAAC AGTAACACTT ATTCCAATAA TCGCAGTAAG TACTACAACT 
TACATCACAA CCATAGGAAA AATAACTGAA CTCTCATTAA ATAATCTTAA ATCTGATTCC 
TATAATACTA TGAGTAATAT AGAACTAAAA ATAAAAAGTT TGGACAGTAC AATCAAGGGA 
GTGGCTTCCC AGACAGACTT TTTGGTTGGA CTTGAAATGG CCAATAGTGT TAATGAAAAG 
ATGGATACAG TAACATATAG CGGAATTCAG CTCTCGATGA AAAATGTAGT AGAAGGATCA 
GAAGGACTCA TTCAAACAAT GTATTTATGC AATAAAAGGG GAAAAGTAAT AGCCACAGCT 
GCAAAAAGAA CAAAAACAGC AGGTGTAGAT GATTTTTATA ATATGCAGCT TTTTGAAAGT 
ATAAAAAAAG ATGCAAACAA TGAAGTTATA GTCGGTAATT CTATTATTTT AAAAGGTGCA 
AACAAAAAGG TTATACCTGT TACGAGAGCA GTTAAAAGTC TGGCAGGTTT TAGCGGAACC 
ATAACTGCAC TGGTGGACTA TGAGAAATTC TTCAAATTTG GTAAGAACCA AATTGAAAGC 
GAAATTATTA TATTGGACAG CGGACTAAAA GCTTTTTACG GCAAGGACAA TAATGAAATA 
AACAGCAAAA TACCAATTAA AGAAGCTGTG GATGATGAAA ATATTACATA TATGGATTCA 
GGAACCAAAA AAATTGCACA CTTGTATAAA TCAGATCTTA CAAACTGGAT AGTGTGTGCT 
CAAATGGACT ATAGCAAAGT AATGTTACCT GTAAAGCAAT ATATTCTCAT CCTAATAATC 
GTTTTGGTTT TATCACTTCT GCTTGCTGCA TTTATTTCCA TCTTTTATTC AAAATATATA 
TCAAGTCCTG TAGTTGAACT CACACGACAA ATAAAGAAAG TTGAAGATGG CTTTCTGGAA 
GTTCATTTTG AAAAAAGAAG CAATATATCA GAAATAAACA GTTTAACAAC TGCATTTGAA 
AATATGGTTA GAAATTTAAA TATACTTATT TCCGGTATTA GCTCGGCTTC CAAGGAAATA 
GACGAAATGT CCGCCCTTAT GTATAGTGAG GCCAGTGAGT CATTTGAAAA GTCAGAATTT 
ACTCAAAAAT CAATCTCAAA CATAAATGTT AATATAAAGG ACCAAGCGGA CAATACAAGC 
AACGCGACGG TGGAAATAAA AAGTCTTGCA GAACAGATTG CTACAACAAG GGAACATTCA 
AACAATGTCT ACAACTTTCT TGACAGGCTT AACAATTCAG CAAAAAGAGG TAAAAGCCAA 
ATGGATAAGC TGGAGGCAAA TTCTACACTA AATCTGCAAA GCATTAGTAA AATGAATGAA 
ATGATAATTG GGCTCCAGAC ACAAATGAAA CAGATAAATA CTATAACTGC TGCAATTCAG 
AGTGTAGCTA AACAGACACA GTTGTTGTCA CTTAATGCAA GGATAGAGGC TTCAAGGGCA 
GGGGAATCGG GAAAAGGCTT TGCTGTAGTG GCTGATGAAA TTAAGGAACT ATCTATTCAG 
ACAAACTCAC AAGCAGGAGT AATTAGAAAT ATGATTGAGA GTATTGTACA AAATTCAAAC 
AACCTGACTA AGGGCTTTGA AGAGGTAAGC AAAGGAACTG ATTCTCAAAA TAGCTGTATT 
AATGAAACAA AAGACTGCTT TCTGGAAATC AAAAAGAACA TTGATAATAT AAATAGCCGT 
CTTTTTAATA TAACAGATTA TTTACAGGAA ATGGATAAAC AGAAAGACAA TCTTGTATTA 
CTGGTAAATC AAATAAATAA CGCTGCCGTA GAGATAGCAC ACAGTTCTGA CCATGTTCAT 
GAATACACTA AAAACCATAT TATTTCTGTA AAAAAAGTCC ATGAAAAATC AAACATATTT 
AAGAGCTTAT CCCAAAAACT GAATTCATCT GTAGGATTAT TTAAAGTTTA G

Protein sequence

MSVTKICRKI KNTNIRLRIQ LLIVLITVTL IPIIAVSTTT YITTIGKITE LSLNNLKSDS 
YNTMSNIELK IKSLDSTIKG VASQTDFLVG LEMANSVNEK MDTVTYSGIQ LSMKNVVEGS 
EGLIQTMYLC NKRGKVIATA AKRTKTAGVD DFYNMQLFES IKKDANNEVI VGNSIILKGA 
NKKVIPVTRA VKSLAGFSGT ITALVDYEKF FKFGKNQIES EIIILDSGLK AFYGKDNNEI 
NSKIPIKEAV DDENITYMDS GTKKIAHLYK SDLTNWIVCA QMDYSKVMLP VKQYILILII 
VLVLSLLLAA FISIFYSKYI SSPVVELTRQ IKKVEDGFLE VHFEKRSNIS EINSLTTAFE 
NMVRNLNILI SGISSASKEI DEMSALMYSE ASESFEKSEF TQKSISNINV NIKDQADNTS 
NATVEIKSLA EQIATTREHS NNVYNFLDRL NNSAKRGKSQ MDKLEANSTL NLQSISKMNE 
MIIGLQTQMK QINTITAAIQ SVAKQTQLLS LNARIEASRA GESGKGFAVV ADEIKELSIQ 
TNSQAGVIRN MIESIVQNSN NLTKGFEEVS KGTDSQNSCI NETKDCFLEI KKNIDNINSR 
LFNITDYLQE MDKQKDNLVL LVNQINNAAV EIAHSSDHVH EYTKNHIISV KKVHEKSNIF 
KSLSQKLNSS VGLFKV