Gene EcSMS35_4506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4506
Symbol	dinF
ID	6143547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4605345
End bp	4606670
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	641619322
Product	DNA-damage-inducible SOS response protein
Protein accession	YP_001746434
Protein GI	170682064
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTCC TCACTTCATC TGATAAAGCG CTCTGGCATC TCGCCTTACC CATGATTTTC 
TCCAATATCA CCGTTCCGTT GCTGGGACTG GTCGATACGG CGGTAATTGG TCATCTTGAT 
AGTCCGGTTT ATTTGGGCGG CGTGGCGGTT GGTGCAACGG CGACCAGCTT TCTCTTTATG 
CTGTTGCTGT TTTTACGCAT GAGCACCACC GGGCTGACTG CGCAGGCTTA TGGTGCCAAA 
AATCCTCAGG CATTAGCCCG TGCGCTGGTG CAACCGTTGC TGTTGGCGTT GGGGGCTGGG 
GCGTTAATTG CGCTGCTGCG TACGCCGATT ATCGATCTGG CGCTGCATAT TGTTGGCGGC 
AGCGAAGCGG TGCTAGAACA GGCGCGACGC TTTCTTGAAA TCCGCTGGTT AAGTGCACCG 
GCGTCGCTGG CGAATCTGGT ATTACTTGGT TGGTTACTCG GTGTGCAATA TGCCCGTGCG 
CCAGTAATTT TGTTAGTGGT CGGCAATATC CTCAACATTG TGCTGGATGT CTGGCTGGTG 
ATGGGGCTGC ATATGAACGT GCAGGGCGCG GCGCTGGCGA CGGTTATTGC GGAATATGCA 
ACATTGCTGA TTGGTCTGCT AATGGTGCGT AAAATCCTCA AACTACGCGG AATCTCCGGC 
GAAATGCTGA AAACTGCCTG GCGAGGAAAC TTCCGTCACT TGCTGGCGCT TAACCGCGAT 
ATCATGCTGC GCTCGCTGTT GTTGCAACTC TGTTTCGGCG CGATCACCGT ACTTGGCGCG 
CGACTGGGGA GTGACATTAT CGCTGTTAAC GCGGTTCTGA TGACGTTACT CACCTTTACC 
GCCTATGCGC TGGATGGTTT TGCCTACGCG GTTGAAGCGC ATTCCGGTCA GGCGTACGGT 
GCGCGCGATG GTAGCCAGTT ACTGGATGTC TGGCGGGCAG CGTGCCGCCA GTCGGGGATT 
GTAGCGTTAC TGTTTTCGGT GGTTTATTTG CTGGCAGGGG AACACATCAT TGCGTTGCTG 
ACGTCGTTAA CCCAGATTCA GCAGCTGGCT GACCGCTATC TTATCTGGCA GGTGATTTTG 
CCGTTGGTCG GCGTCTGGTG TTATCTGCTC GACGGCATGT TTATAGGTGC AACGCGCGCC 
GCCGAAATGC GTAACAGTAT GGCGGTGGCC GCCGCAGGTT TTGCGCTGAC GCTCCTTACG 
CTGCCGTGGC TGGGGAATCA TGGTTTGTGG CTGGCATTAA CCGTCTTTCT GGCGTTACGC 
GGGCTTTCTC TGGCGGCTAT CTGGCGGCGT CACTGGCGCA ACGGTACCTG GTTTGCCGCA 
ACGTGA

Protein sequence

MAFLTSSDKA LWHLALPMIF SNITVPLLGL VDTAVIGHLD SPVYLGGVAV GATATSFLFM 
LLLFLRMSTT GLTAQAYGAK NPQALARALV QPLLLALGAG ALIALLRTPI IDLALHIVGG 
SEAVLEQARR FLEIRWLSAP ASLANLVLLG WLLGVQYARA PVILLVVGNI LNIVLDVWLV 
MGLHMNVQGA ALATVIAEYA TLLIGLLMVR KILKLRGISG EMLKTAWRGN FRHLLALNRD 
IMLRSLLLQL CFGAITVLGA RLGSDIIAVN AVLMTLLTFT AYALDGFAYA VEAHSGQAYG 
ARDGSQLLDV WRAACRQSGI VALLFSVVYL LAGEHIIALL TSLTQIQQLA DRYLIWQVIL 
PLVGVWCYLL DGMFIGATRA AEMRNSMAVA AAGFALTLLT LPWLGNHGLW LALTVFLALR 
GLSLAAIWRR HWRNGTWFAA T