Gene EcHS_A1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1503
Symbol	trg
ID	5595393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1512899
End bp	1514539
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	51%
IMG OID	640920660
Product	methyl-accepting chemotaxis protein III
Protein accession	YP_001458216
Protein GI	157160898
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAA CTCCCTCACA GCGATTAGGT TTTTTGCATC ACATCAGGCT GGTTCCGTTA 
TTTGCCTGCA TTCTTGGCGG TATCTTAGTT CTATTCGCAT TAAGTTCTGC TCTGGCTGGC 
TATTTCCTCT GGCAGGCCGA TCGCGATCAG CGTGATGTTA CTGCGGAGAT TGAGATTCGA 
ACCGGGTTAG CGAACAGTTC AGATTTTTTG CGTTCAGCCC GGATCAATAT GATTCAGGCC 
GGGGCTGCGA GTCGTATTGC GGAAATGGAA GCAATGAAGC GAAATATTGC GCAAGCCGAA 
TCGGAGATTA AACAGTCGCA GCAAGGTTAT CGTGCTTATC AGAATCGACC GGTGAAAACA 
CCTGCTGATG AAGCCCTCGA CACTGAATTA AATCAACGCT TTCAGGCTTA TATCACGGGT 
ATGCAACCTA TGTTGAAATA TGCCAAAAAT GGCATGTTTG AAGCGATTAT CAATCATGAA 
AGTGAGCAGA TCCGACCGCT GGATAATGCT TATACCGATA TTTTGAACAA AGCCGTTAAG 
ATACGTAGCA CCAGAGCCAA CCAACTGGCG GAACTGGCCC ATCAGCGCAC CCGCCTGGGT 
GGGATGTTCA TGATTGGCGC GTTTGTGCTT GCCCTGGTCA TGACGCTGAT AACATTTATG 
GTGCTACGTC GGATCGTCAT TCGTCCACTG CAACATGCCG CACAACGGAT TGAAAAAATC 
GCTAGTGGCG ATCTGACGAT GAAGAATGAA CCGGCGGGTC GTAATGAAAT CGGTCGCTTA 
AGTCGTCATT TACAGCAAAT GCAGCATTCA CTGGGGATGA CAGTAGGGAC TGTTCGACAG 
GGTGCGGAAG AGATTTATCG TGGCACCAGC GAAATTTCAG CTGGCAATGC GGACCTGTCA 
TCTCGCACCG AAGAACAAGC GGCGGCTATC GAACAAACTG CCGCTAGCAT GGAGCAACTC 
ACTGCGACGG TGAAACAGAA TGCGGATAAC GCGCATCATG CCAGCAAACT GGCGCAAGAG 
GCTTCTATTA AAGCCAGCGA TGGCGGGCAG ACGGTTTCCG GTGTAGTAAA AACGATGGGC 
GCTATCTCTA CAAGTTCGAA GAAAATTTCC GAGATCACCG CCGTCATCAA CAGTATTGCT 
TTCCAGACGA ATATTCTGGC ACTGAATGCT GCCGTTGAAG CCGCGCGAGC GGGTGAGCAA 
GGCCGTGGAT TTGCCGTTGT CGCCAGCGAA GTACGGACAC TCGCAAGCCG CAGCGCCCAA 
GCGGCGAAAG AGATTGAAGG CTTGATCAGT GAATCAGTCA GGTTAATTGA CCTGGGGTCG 
GATGAGGTGG CAACGGCAGG GAAAACCATG AGCACTATTG TTGATGCCGT CGCGAGTGTC 
ACACATATCA TGCAGGAAAT CGCCGCCGCC TCGGATGAAC AAAGTAGAGG CATAACGCAG 
GTTAGCCAGG CGATTTCTGA AATAGATAAG GTGACGCAAC AGAATGCTTC TCTGGTAGAA 
GAGGCCTCAG CGGCGGCGTT GTCCCTTGAA GAACAGGCGG CACGATTAAC TGAGGCGGTG 
GATGTATTCC GTCTGCACAA ACATTCTGTG TCGGCAAAAC CTCGCGGAGC GGGTGAACCA 
GTTAGTTTCG CTACGGTGTG A

Protein sequence

MNTTPSQRLG FLHHIRLVPL FACILGGILV LFALSSALAG YFLWQADRDQ RDVTAEIEIR 
TGLANSSDFL RSARINMIQA GAASRIAEME AMKRNIAQAE SEIKQSQQGY RAYQNRPVKT 
PADEALDTEL NQRFQAYITG MQPMLKYAKN GMFEAIINHE SEQIRPLDNA YTDILNKAVK 
IRSTRANQLA ELAHQRTRLG GMFMIGAFVL ALVMTLITFM VLRRIVIRPL QHAAQRIEKI 
ASGDLTMKNE PAGRNEIGRL SRHLQQMQHS LGMTVGTVRQ GAEEIYRGTS EISAGNADLS 
SRTEEQAAAI EQTAASMEQL TATVKQNADN AHHASKLAQE ASIKASDGGQ TVSGVVKTMG 
AISTSSKKIS EITAVINSIA FQTNILALNA AVEAARAGEQ GRGFAVVASE VRTLASRSAQ 
AAKEIEGLIS ESVRLIDLGS DEVATAGKTM STIVDAVASV THIMQEIAAA SDEQSRGITQ 
VSQAISEIDK VTQQNASLVE EASAAALSLE EQAARLTEAV DVFRLHKHSV SAKPRGAGEP 
VSFATV