Gene EcolC_2238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2238
Symbol
ID	6067316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2457232
End bp	2458872
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	51%
IMG OID	641601643
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001725202
Protein GI	170020248
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAA CTCCCTCACA GCGATTAGGT TTTTTGCATC ACATCAGGCT GGTTCCGTTA 
TTTGCCTGCA TTCTTGGCGG TATCTTAGTT CTATTCGCAT TAAGTTCTGC TCTGGCTGGC 
TATTTCCTCT GGCAGGCCGA TCGCGATCAG CGTGATGTTA CTGCGGAGAT TGAGATTCGA 
ACCGGGTTAG CGAACAGTTC AGATTTTTTG CGTTCAGCCC GGATCAATAT GATTCAGGCC 
GGGGCTGCGA GTCGTATTGC GGAAATGGAA GCAATGAAGC GAAATATTGC GCAAGCCGAA 
TCGGAGATTA AACAGTCGCA GCAAGGTTAT CGTGCTTATC AGAATCGACC GGTGAAAACA 
CCTGCTGATG AAGCCCTCGA CACTGAATTA AATCAACGCT TTCAGGCTTA TATCACGGGT 
ATGCAACCTA TGTTGAAATA TGCCAAAAAT GGCATGTTTG AAGCGATTAT CAATCATGAA 
AGTGAGCAGA TCCGACCGCT GGATAATGCT TATACCGATA TTTTGAACAA AGCCGTTAAG 
ATACGTAGCA CCAGAGCCAA CCAACTGGCG GAACTGGCCC ATCAGCGCAC CCGCCTGGGT 
GGGATGTTCA TGATTGGCGC GTTTGTGCTT GCCCTGGTCA TGACGCTGAT AACATTTATG 
GTGCTACGTC GGATCGTCAT TCGTCCACTG CAACATGCCG CACAACGGAT TGAAAAAATC 
GCTAGTGGCG ATCTGACGAT GAAGGATGAA CCGGCGGGTC GTAATGAAAT CGGTCGCTTA 
AGTCGTCATT TACAGCAAAT GCAGCATTCA CTGGGGATGA CAGTAGGGAC TGTTCGACAG 
GGTGCGGAAG AGATTTATCG TGGCACCAGC GAAATTTCAG CTGGCAATGC GGACCTGTCA 
TCTCGCACCG AAGAACAAGC GGCGGCTATC GAACAAACTG CCGCTAGCAT GGAGCAACTC 
ACTGCGACGG TGAAACAGAA TGCGGATAAC GCGCATCATG CCAGCAAACT GGCGCAAGAG 
GCTTCTATTA AAGCCAGCGA TGGCGGGCAG ACGGTTTCCG GTGTAGTAAA AACGATGGGC 
GCTATCTCTA CAAGTTCGAA GAAAATTTCC GAGATCACCG CCGTCATCAA CAGTATTGCT 
TTCCAGACGA ATATTCTGGC ACTGAATGCT GCCGTTGAAG CCGCGCGAGC GGGTGAGCAA 
GGCCGTGGAT TTGCCGTTGT CGCCAGCGAA GTACGGACAC TCGCAAGCCG CAGCGCCCAA 
GCGGCGAAAG AGATTGAAGG CTTGATCAGT GAATCAGTCA GGTTAATTGA CCTGGGGTCG 
GATGAGGTGG CAACGGCAGG GAAAACCATG AGCACTATTG TTGATGCCGT CGCGAGTGTC 
ACACATATCA TGCAGGAAAT CGCCGCCGCC TCGGATGAAC AAAGTAGAGG CATAACGCAG 
GTTAGCCAGG CGATTTCTGA AATAGATAAG GTGACGCAAC AGAATGCTTC TCTGGTAGAA 
GAGGCCTCAG CGGCGGCGTT GTCCCTTGAA GAACAGGCGG CACGATTAAC TGAGGCGGTG 
GATGTATTCC GTCTGCACAA ACATTCTGTG TCGGCAAAAC CTCGCGGAGC GGGTGAACCA 
GTTAGTTTCG CTACGGTGTG A

Protein sequence

MNTTPSQRLG FLHHIRLVPL FACILGGILV LFALSSALAG YFLWQADRDQ RDVTAEIEIR 
TGLANSSDFL RSARINMIQA GAASRIAEME AMKRNIAQAE SEIKQSQQGY RAYQNRPVKT 
PADEALDTEL NQRFQAYITG MQPMLKYAKN GMFEAIINHE SEQIRPLDNA YTDILNKAVK 
IRSTRANQLA ELAHQRTRLG GMFMIGAFVL ALVMTLITFM VLRRIVIRPL QHAAQRIEKI 
ASGDLTMKDE PAGRNEIGRL SRHLQQMQHS LGMTVGTVRQ GAEEIYRGTS EISAGNADLS 
SRTEEQAAAI EQTAASMEQL TATVKQNADN AHHASKLAQE ASIKASDGGQ TVSGVVKTMG 
AISTSSKKIS EITAVINSIA FQTNILALNA AVEAARAGEQ GRGFAVVASE VRTLASRSAQ 
AAKEIEGLIS ESVRLIDLGS DEVATAGKTM STIVDAVASV THIMQEIAAA SDEQSRGITQ 
VSQAISEIDK VTQQNASLVE EASAAALSLE EQAARLTEAV DVFRLHKHSV SAKPRGAGEP 
VSFATV