Gene ECH74115_0284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0284
Symbol	frsA
ID	6968739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	296975
End bp	298219
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	53%
IMG OID	643384350
Product	fermentation/respiration switch protein
Protein accession	YP_002268866
Protein GI	209400884
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.117184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.397141
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGG CAAACCTGAG CGAAACCCTG TTCAAACCCC GCTTTAAACA TCCTGAAACC 
TCGACGCTAG TCCGCCGCTT TAATCACGGC GCACAACCGC CTGTGCAGTC GGCCCTTGAT 
GGTAAAACCA TCCCTCACTG GTATCGCATG ATTAACCGTC TGATGTGGAT CTGGCGCGGC 
ATTGACCCAC GCGAAATCCT CGACGTCCAG GCACGTATTG TGATGAGCGA TGCCGAACGT 
ACCGACGATG ATTTATACGA TACGGTGATT GGCTACCGTG GCGGCAACTG GATTTATGAG 
TGGGCCACCC AGGCGATGGT GTGGCAACAA AAAGCCTGTG CGGAAGAAGA TCCGCAACTC 
AGTGGTCGTC ACTGGCTGCA TGCGGCTACG TTGTACAACA TTGCCGCCTA TCCTCATCTG 
AAAGGAGATG ACCTGGCCGA GCAAGCGCAG GCTTTGTCAA ACCGCGCCTA TGAAGAGGCC 
GCTCAGCGTC TACCGGGCAC GATGCGACAG ATGGAGTTTA CCGTACCCGG CGGTGCGCCC 
ATCACCGGCT TTTTGCATAT GCCGAAAGGC GATGGCCCGT TCCCGACGGT ATTAATGTGT 
GGTGGTCTGG ATGCGATGCA GACGGACTAT TACAGCCTGT ATGAACGTTA TTTTGCGCCG 
CGCGGCATTG CGATGCTGAC TATTGATATG CCGTCGGTGG GCTTTTCTTC AAAATGGAAG 
CTCACCCAGG ACTCCTGCCT GTTGCATCAG CGCGTCTTAA AGGCTCTGCC TAACGTACCG 
TGGGTGGATC ACACTCGCGT CGCGGCCTTT GGTTTCCGTT TCGGCGCTAA CGTTGCCGTG 
CGTCTGGCAT ATCTTGAATC GCCGCGTCTG AAAGCGGTTG CCTGTCTTGG TCCGGTAGTT 
CATACCCTGT TGAGTGATTT TAAGTGCCAG CAACAGGTGC CGGAAATGTA TCTTGACGTT 
CTGGCGAGTC GTTTGGGGAT GCATGATGCT TCCGACGAAG CGTTGCGCGT GGAGCTGAAT 
CGCTATTCAT TAAAAGTGCA AGGATTGCTG GGACGTCGAT GCCCAACGCC AATGTTATCA 
GGCTACTGGA AGAACGATCC GTTCAGCCCG GAAGAGGACT CACGCTTAAT CACCTCATCA 
TCTGCTGACG GTAAATTATT AGAGATCCCA TTTAACCCGG TGTATCGGAA TTTTGACAAA 
GGTCTTCAGG AAATCACCGA CTGGATCGAA AAACGCTTGT GTTAA

Protein sequence

MTQANLSETL FKPRFKHPET STLVRRFNHG AQPPVQSALD GKTIPHWYRM INRLMWIWRG 
IDPREILDVQ ARIVMSDAER TDDDLYDTVI GYRGGNWIYE WATQAMVWQQ KACAEEDPQL 
SGRHWLHAAT LYNIAAYPHL KGDDLAEQAQ ALSNRAYEEA AQRLPGTMRQ MEFTVPGGAP 
ITGFLHMPKG DGPFPTVLMC GGLDAMQTDY YSLYERYFAP RGIAMLTIDM PSVGFSSKWK 
LTQDSCLLHQ RVLKALPNVP WVDHTRVAAF GFRFGANVAV RLAYLESPRL KAVACLGPVV 
HTLLSDFKCQ QQVPEMYLDV LASRLGMHDA SDEALRVELN RYSLKVQGLL GRRCPTPMLS 
GYWKNDPFSP EEDSRLITSS SADGKLLEIP FNPVYRNFDK GLQEITDWIE KRLC