Gene EcSMS35_0506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0506
Symbol	acrA
ID	6144292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	512739
End bp	513968
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	54%
IMG OID	641615400
Product	acriflavine resistance protein A
Protein accession	YP_001742607
Protein GI	170681835
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.951175
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCAATT TGAAATCGGA CACTCGAGGT TTACATATGA ACAAAAACAG AGGGTTTACG 
CCTCTGGCGG TCGTTCTGAT GCTCTCAGGC AGCTTAGCCC TAACAGGATG TGACGACAAA 
CAGGCCCAAC AAGGTGGCCA GCAGATGCCC GCCGTTGGCG TAGTAACAGT CAAAACTGAA 
CCTCTGCAGA TCACAACCGA GCTTCCGGGT CGCACCAGTG CCTACCGGAT CGCAGAAGTT 
CGTCCTCAAG TTAGCGGGAT TATCCTGAAG CGTAATTTCA AAGAAGGTAG CGACATCGAA 
GCAGGTGTCT CTCTCTATCA GATTGATCCT GCGACCTATC AGGCGGCATA CGACAGTGCG 
AAAGGTGATC TGGCGAAAGC CCAGGCTGCA GCCAATATCG CGCAATTGAC GGTGAATCGT 
TATCAGAAAT TGCTCGGTAC TCAGTACATC AGTAAGCAAG AGTACGATCA GGCTCTGGCT 
GATGCGCAAC AGGCGAATGC TGCGGTCACT GCGGCGAAAG CTGCCGTTGA AACTGCGCGG 
ATCAATCTGG CTTACACCAA AGTCACCTCG CCGATTAGCG GTCGCATTGG TAAGTCGAAC 
GTGACAGAAG GCGCATTGGT ACAGAACGGT CAGGCGACTG CGCTGGCAAC CGTGCAGCAA 
CTTGATCCGA TCTACGTTGA TGTGACCCAG TCCAGCAACG ACTTCCTGCG CCTGAAACAG 
GAACTGGCAA ATGGCACGCT GAAACAAGAG AACGGCAAAG CCAAAGTGTC GCTGATCACC 
AGTGACGGCA TTAAGTTCCC GCAGGACGGT ACGCTGGAAT TCTCTGACGT TACCGTTGAT 
CAGACCACCG GGTCTATCAC CCTACGCGCT ATCTTCCCGA ACCCGGATCA CACTCTGCTG 
CCGGGTATGT TCGTACGTGC GCGTCTGGAA GAAGGGCTTA ATCCAAACGC TATTTTAGTC 
CCGCAACAGG GCGTAACCCG TACGCCGCGT GGCGATGCCA CCGTACTGGT GGTTGGCGCG 
GATGACAAAG TGGAAACCCG TCCGATCGTT GCAAGCCAGG CTATCGGCGA TAAGTGGCTG 
GTGACAGAAG GTCTGAAAGC AGGCGATCGC GTAGTAATAA GTGGGCTGCA GAAAGTGCGT 
CCTGGTGTCC AGGTAAAAGC ACAAGAAGTT ACCGCTGATA ATAACCAGCA AGCCGCAAGC 
GGTGCTCAGC CTGAACAGTC CAAGTCTTAA

Protein sequence

MTNLKSDTRG LHMNKNRGFT PLAVVLMLSG SLALTGCDDK QAQQGGQQMP AVGVVTVKTE 
PLQITTELPG RTSAYRIAEV RPQVSGIILK RNFKEGSDIE AGVSLYQIDP ATYQAAYDSA 
KGDLAKAQAA ANIAQLTVNR YQKLLGTQYI SKQEYDQALA DAQQANAAVT AAKAAVETAR 
INLAYTKVTS PISGRIGKSN VTEGALVQNG QATALATVQQ LDPIYVDVTQ SSNDFLRLKQ 
ELANGTLKQE NGKAKVSLIT SDGIKFPQDG TLEFSDVTVD QTTGSITLRA IFPNPDHTLL 
PGMFVRARLE EGLNPNAILV PQQGVTRTPR GDATVLVVGA DDKVETRPIV ASQAIGDKWL 
VTEGLKAGDR VVISGLQKVR PGVQVKAQEV TADNNQQAAS GAQPEQSKS