Gene EcolC_3342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3342
Symbol	frsA
ID	6067362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3666656
End bp	3667900
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	53%
IMG OID	641602758
Product	fermentation/respiration switch protein
Protein accession	YP_001726290
Protein GI	170021336
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0412] Dienelactone hydrolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGG CAAACCTGAG CGAAACCCTG TTCAAACCCC GCTTTAAACA TCCTGAAACC 
TCGACGCTAG TCCGCCGCTT TAATCACGGC GCACAACCGC CTGTGCAGTC GGCCCTTGAT 
GGTAAAACCA TCCCTCACTG GTATCGCATG ATTAACCGTC TGATGTGGAT CTGGCGCGGC 
ATTGACCCAC GCGAAATCCT CGACGTCCAG GCACGTATTG TGATGAGCGA TGCCGAACGT 
ACCGACGATG ATTTATACGA TACGGTGATT GGCTACCGTG GCGGCAACTG GATTTATGAG 
TGGGCCACCC AGGCGATGGT GTGGCAACAA AAAGCCTGTG CGGAAGAAGA TCCGCAACTC 
AGTGGTCGTC ACTGGCTGCA TGCGGCTACG TTGTACAACA TTGCTGCCTA TCCTCATCTG 
AAAGGAGATG ACCTTGCCGA GCAAGCGCAG GCTTTGTCAA ACCGCGCCTA TGAAGAAGCC 
GCCCAGCGTC TGCCGGGCAC GATGCGGCAG ATGGAGTTTA CCGTACCCGG CGGTGCGCCC 
ATCACCGGCT TTTTGCATAT GCCGAAAGGC GATGGCCCGT TCCCGACAGT ATTAATGTGT 
GGTGGTCTGG ATGCGATGCA GACGGACTAT TACAGCCTGT ATGAACGTTA TTTTGCGCCG 
CGCGGCATTG CGATGCTGAC TATTGATATG CCGTCGGTGG GCTTTTCATC AAAATGGAAG 
CTCACCCAGG ACTCCAGCCT GTTGCATCAG CACGTCTTAA AGGCTCTGCC TAACGTACCG 
TGGGTGGATC ACACTCGCGT CGCGGCCTTT GGTTTCCGTT TCGGCGCTAA CGTTGCCGTG 
CGTCTGGCAT ATCTTGAATC GCCGCGTCTG AAAGCGGTTG CCTGTCTTGG TCCGGTAGTT 
CATACCCTGT TGAGTGATTT TAAGTGCCAG CAACAGGTGC CGGAAATGTA TCTTGACGTT 
CTGGCGAGTC GTTTGGGGAT GCATGATGCT TCCGATGAAG CGTTGCGCGT GGAGCTGAAT 
CGCTATTCAT TAAAAGTGCA AGGATTGCTG GGACGTCGCT GCCCAACGCC AATGTTATCA 
GGCTACTGGA AGAACGATCC GTTCAGCCCA GAAGAGGACT CACGCTTAAT CACCTCATCA 
TCTGCTGACG GTAAATTATT AGAGATCCCA TTTAACCCGG TGTATCGGAA TTTTGACAAA 
GGTCTTCAGG AAATCACAGA CTGGATCGAA AAACGTTTGT GTTAA

Protein sequence

MTQANLSETL FKPRFKHPET STLVRRFNHG AQPPVQSALD GKTIPHWYRM INRLMWIWRG 
IDPREILDVQ ARIVMSDAER TDDDLYDTVI GYRGGNWIYE WATQAMVWQQ KACAEEDPQL 
SGRHWLHAAT LYNIAAYPHL KGDDLAEQAQ ALSNRAYEEA AQRLPGTMRQ MEFTVPGGAP 
ITGFLHMPKG DGPFPTVLMC GGLDAMQTDY YSLYERYFAP RGIAMLTIDM PSVGFSSKWK 
LTQDSSLLHQ HVLKALPNVP WVDHTRVAAF GFRFGANVAV RLAYLESPRL KAVACLGPVV 
HTLLSDFKCQ QQVPEMYLDV LASRLGMHDA SDEALRVELN RYSLKVQGLL GRRCPTPMLS 
GYWKNDPFSP EEDSRLITSS SADGKLLEIP FNPVYRNFDK GLQEITDWIE KRLC