Gene EcSMS35_0293 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0293
Symbol	frsA
ID	6144512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	301071
End bp	302315
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	54%
IMG OID	641615190
Product	fermentation/respiration switch protein
Protein accession	YP_001742399
Protein GI	170681335
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0412] Dienelactone hydrolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0072363
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACAGG CAAACCTGAG CGAAACCCTG TTCAAACCCC GCTTTAAACA TCCTGAAACC 
TCGACGCTAG TCCGCCGCTT TAATCACGGC GCACAACCGC CTGTGCAGTC GGCCCTTGAT 
GGTAAAACCA TCCCTCACTG GTATCGCATG ATTAACCGTC TGATGTGGAT CTGGCGCGGC 
ATTGACCCAC GTGAAATCCT CGACGTCCAG GCGCGTATTG TGATGAGCGA TGCCGAACGT 
ACCGACGATG ATTTATACGA TACGGTGATT GGCTACCGCG GCGGCAACTG GATTTATGAG 
TGGGCTACCC AGGCGATGGT GTGGCAACAA AAAGCCTGTG CGGAAGAAGA TCCGCAACTC 
AGCGGTCGAC ACTGGCTGCA TGCGGCTACG TTGTACAACA TTGCTGCCTA TCCTCATCTG 
AAAGGAGATG ACCTGGCCGA GCAAGCGCAG GCTTTGTCAA ACCGCGCCTA TGAAGAGGCC 
GCTCAGCGTC TGCCGGGCAC GATGCGGCAG ATGGAGTTTA CCGTACCCGG CGGTGCGCCC 
ATCACCGGCT TTTTGCATAT GCCGAAAGGT GATGGCCCGT TCCCGACAGT ATTAATGTGT 
GGTGGTCTGG ATGCGATGCA GACGGACTAT TACAGCCTGT ATGAACGTTA TTTTGCGCCG 
CGCGGCATTG CGATGCTGAC TATTGATATG CCGTCGGTGG GCTTTTCTTC AAAATGGAAG 
CTCACCCAGG ACTCCAGCCT GTTGCATCAG CACGTCTTAA AGGCGCTGCC TAACGTACCG 
TGGGTAGATC ACACTCGCGT CGCGGCCTTT GGTTTCCGTT TCGGCGCTAA CGTTGCCGTG 
CGTCTGGCAT ACCTTGAATC GCCGCGTCTG AAAGCGGTTG CCTGTCTTGG TCCGGTAGTT 
CATACCCTGT TGAGTGATTT TAAGTGCCAG CAACAGGTGC CGGAAATGTA TCTTGACGTT 
CTGGCGAGCC GTTTGGGGAT GCATGATGCT TCCGACGAAG CGTTGCGCGT GGAGCTGAAT 
CGCTATTCAT TAAAAGTGCA AGGATTGCTG GGACGTCGCT GCCCAACGCC AATGTTATCA 
GGCTACTGGA AGAACGATCC GTTCAGCCCG GAAGAGGACT CACGCTTAAT CACCTCATCA 
TCTGCTGACG GTAAATTGTT AGAGATCCCA TTTAACCCGG TGTATCGGAA TTTTGACAAA 
GGTCTTCAGG AAATCACCGA CTGGATCGAA AAACGATTGT GTTAA

Protein sequence

MTQANLSETL FKPRFKHPET STLVRRFNHG AQPPVQSALD GKTIPHWYRM INRLMWIWRG 
IDPREILDVQ ARIVMSDAER TDDDLYDTVI GYRGGNWIYE WATQAMVWQQ KACAEEDPQL 
SGRHWLHAAT LYNIAAYPHL KGDDLAEQAQ ALSNRAYEEA AQRLPGTMRQ MEFTVPGGAP 
ITGFLHMPKG DGPFPTVLMC GGLDAMQTDY YSLYERYFAP RGIAMLTIDM PSVGFSSKWK 
LTQDSSLLHQ HVLKALPNVP WVDHTRVAAF GFRFGANVAV RLAYLESPRL KAVACLGPVV 
HTLLSDFKCQ QQVPEMYLDV LASRLGMHDA SDEALRVELN RYSLKVQGLL GRRCPTPMLS 
GYWKNDPFSP EEDSRLITSS SADGKLLEIP FNPVYRNFDK GLQEITDWIE KRLC