Gene Athe_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0206
Symbol
ID	7407197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	253804
End bp	255081
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	38%
IMG OID	643714607
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_002572130
Protein GI	222528248
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACCAA AAAATGAGCA AAATGGCGCT GTCAAAAAAG GAGTTATAAG TCTTACATAT 
GTTGCTTTAG CTTTTATTAT TCTACTTGAC ATCATACTTG GCATTATAAT GCCAACAGCC 
AAATTAAAAC TCTACTCTAT CTTAGTTGCA ACAGTTACAT TTTTACTGAC ACTTTCACTG 
ACTGCTTTTA TGATTCGTTA TGAAATGAAC AAAATGATTT TAAAGCTTGA AGATGTTCTT 
GAAAAAATCA AAAACGGGGA TTACAGCAAA CTGATTTCGT CAAAAGAGTT CGGCAACATC 
CAGAGAGTAG CATCGAGCGT AAACATTGTT CTTTCGGATA TAAAGACGCT TATTGAAAGC 
TTTTTTGACC TGTCAAACGC AATTGTCGGT GCGTCCAAAA AGGTCACAAA GACATCTGAA 
GAAGCAGCCG CTGCAATTGA AGAGATTGCA AAGACAGTTG AGGAAATTGC AAAAGGTGCA 
TCCCAGCAAG CTGAAGAAGC ACAGCATGGT GTTTTGCTTG TAAATAACCT TTCTGAACAG 
ATAAATGCTG TGTCAGAAAG TTATAACGGT GTGATTGAAG AGGCAAACAA GATTGATGTC 
CTCAACAAAG ATGGAATTGA GAAGATGAGT GCTCTTCGGG AAAAGAGTGA AATTGCAGTG 
TCAACAGCTG AAAAGGTAAT CGACACTATT ATGTCTTTTA TTGACAGGAT TAAGAACATC 
TCAAACTTTG TTGAGGTAAT AAACACAATT GCTGAGCAAA CAAACCTTTT AGCACTCAAT 
GCTGCAATTG AGGCAGCAAG AGCAGGTGAA GCAGGAAGAG GGTTTGCAGT TGTTGCAGAC 
GAGGTCAGAA AACTTGCCGA CCAGAGCAAA AAGGCAGCAG ATGAAATAAA TTCTATTGTT 
GATGTGATTT TGGGTGAGAC AGAAAACACA ATAAAGATCA TAGACGAAAT AAAAGAGGCA 
GCACTCGGTC AGAAAGATGC AGTGGTGGAA TCACAGCAGT CTTTTTCAAA AATCTCTGAT 
GAGATAAACG CAATTGTAGA AAAGACATAT GTTGTAAAAG AAGCACTCAG TAGAATGGAA 
GAGGCAAGAA ATGCAGTTAT TCGGGCAATA GAGAGCATAT CTTCTGTATC TGAAGAGACG 
GCGGCAGCAT CACAAGAGGT TGCAGCAACT GTTGAAAATC AGCTAAACTC AATAAACGAA 
ATGAAATACT CTGCACAGTC ACTTCAAAAG CTTGTCGATG AGCTTGAAAA GAGGCTCAAA 
AAATACAAGA TACGATAA

Protein sequence

MPPKNEQNGA VKKGVISLTY VALAFIILLD IILGIIMPTA KLKLYSILVA TVTFLLTLSL 
TAFMIRYEMN KMILKLEDVL EKIKNGDYSK LISSKEFGNI QRVASSVNIV LSDIKTLIES 
FFDLSNAIVG ASKKVTKTSE EAAAAIEEIA KTVEEIAKGA SQQAEEAQHG VLLVNNLSEQ 
INAVSESYNG VIEEANKIDV LNKDGIEKMS ALREKSEIAV STAEKVIDTI MSFIDRIKNI 
SNFVEVINTI AEQTNLLALN AAIEAARAGE AGRGFAVVAD EVRKLADQSK KAADEINSIV 
DVILGETENT IKIIDEIKEA ALGQKDAVVE SQQSFSKISD EINAIVEKTY VVKEALSRME 
EARNAVIRAI ESISSVSEET AAASQEVAAT VENQLNSINE MKYSAQSLQK LVDELEKRLK 
KYKIR