Gene ECH74115_2624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2624
Symbol	tar
ID	6967904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2479254
End bp	2480915
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	52%
IMG OID	643386488
Product	methyl-accepting chemotaxis protein II
Protein accession	YP_002270970
Protein GI	209399651
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.784316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00000000183949
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTAACC GTATCCGCGT AGTCACGCTG TTGGTAATGG TGCTGGGGGT ATTCGCACTG 
TTACAGCTTA TTTCCGGCAG TCTGTTTTTT TCTTCCCTTC ACCATAGCCA GAAGAGCTTT 
GTGGTTTCCA ATCAATTACG AGAACAGCAG GGCGAGCTGA CGTCAACCTG GGATTTAATG 
CTGCAAACGC GCATTAACCT GAGTCGTTCA GCGGTGCGAA TGATGATGGA TTCCTCCAAT 
CAACAAAGTA ATGCCAAAGT TGAATTGCTC GATAGCGCCA GGAAAACATT GGCCCAGGCC 
GCGACTCATT ATAAAAAATT CAAAAGCATG GCACCGTTAC CTGAAATGGT CGCTACCAGT 
CGTAATATTG ATGAAAAATA TAAAAACTAT TACACAGCGT TAACTGAACT GATTGATTAT 
CTTGATTATG GCAATACTGG AGCTTATTTC GCTCAGCCAA CCCAGGGAAT GCAAAATGCA 
ATGGGCGAAG CGTTTGCTCA GTACGCCCTC AGCAGTGAAA AAGTGTATCG CGATATCGTC 
ACTGACAACG CAGATGATTA CCGATTTGCC CAGTGGCAAC TGGCGGTTAT CGCGCTGGTG 
GTGGTATTGA TTCTGCTGGT GGCGTGGTAT GGCATTCGCC GTATGTTGCT TACACCGCTG 
GCAAAAATTA TTGCTCACAT TCGCGAAATC GCCGGTGGTA ACCTGGCGAA TACCCTGACC 
ATTGACGGGC GCAGTGAAAT GGGCGACCTG GCGCAGAGCG TTTCACATAT GCAACGCTCT 
TTGACTGACA CCGTCACTCA TGTCCGCGAA GGTTCAGATG CCATCTATGC CGGTACCCGT 
GAAATTGCGG CGGGCAACAC CGATCTTTCC TCCCGTACGG AACAGCAGGC ATCCGCGCTG 
GAAGAAACTG CCGCCAGCAT GGAGCAGCTC ACCGCGACAG TGAAGCAAAA CGCCGATAAC 
GCCCGCCAGG CCTCGCAACT GGCGCAAAGT GCCTCCGACA CCGCCCAGCA CGGCGGCAAA 
GTGGTGGATG GCGTAGTGAA AACGATGCAT GAGATCGCCG ATAGTTCGAA GAAAATCGCC 
GACATTATCA GCGTAATCGA CGGTATTGCC TTCCAGACTA ATATCCTCGC GCTGAATGCC 
GCTGTTGAAG CCGCGCGAGC GGGTGAACAG GGCCGTGGTT TTGCCGTGGT GGCGGGCGAA 
GTGCGTAATC TTGCCAGTCG TAGCGCCCAG GCGGCAAAAG AGATCAAAGC TCTCATTGAA 
GACTCCGTCT CGCGCGTTGA TACCGGTTCG GTGCTGGTCG AAAGCGCCGG GGAAACAATG 
AACAATATCG TCGATGCTGT CACTCGCGTG ACTGACATTA TGGGCGAGAT TGCATCGGCA 
TCGGATGAAC AGAGCCGTGG CATTGATCAA GTCGCATTGG CGGTTTCGGA AATGGATCAC 
GTCACGCAAC AGAACGCATC GCTGGTGCAG GAATCAGCTG CCGCTGCAGC TGCGCTGGAA 
GAACAGGCTA GTCGTTTAAC GCAAGCGGTT TCCGCGTTTC GTCTGGCAGC CAGCCCACTC 
ACCAATAAAC CGCAAACACC ATCCCGTCCT GCCAGTGAGC AACCACCGGC ACAGCCACGA 
CTGCGAATTG CTGAACAAGA TCCAAACTGG GAAACATTTT GA

Protein sequence

MINRIRVVTL LVMVLGVFAL LQLISGSLFF SSLHHSQKSF VVSNQLREQQ GELTSTWDLM 
LQTRINLSRS AVRMMMDSSN QQSNAKVELL DSARKTLAQA ATHYKKFKSM APLPEMVATS 
RNIDEKYKNY YTALTELIDY LDYGNTGAYF AQPTQGMQNA MGEAFAQYAL SSEKVYRDIV 
TDNADDYRFA QWQLAVIALV VVLILLVAWY GIRRMLLTPL AKIIAHIREI AGGNLANTLT 
IDGRSEMGDL AQSVSHMQRS LTDTVTHVRE GSDAIYAGTR EIAAGNTDLS SRTEQQASAL 
EETAASMEQL TATVKQNADN ARQASQLAQS ASDTAQHGGK VVDGVVKTMH EIADSSKKIA 
DIISVIDGIA FQTNILALNA AVEAARAGEQ GRGFAVVAGE VRNLASRSAQ AAKEIKALIE 
DSVSRVDTGS VLVESAGETM NNIVDAVTRV TDIMGEIASA SDEQSRGIDQ VALAVSEMDH 
VTQQNASLVQ ESAAAAAALE EQASRLTQAV SAFRLAASPL TNKPQTPSRP ASEQPPAQPR 
LRIAEQDPNW ETF