Gene EcSMS35_1831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1831
Symbol	sapD
ID	6143579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1852107
End bp	1853099
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	51%
IMG OID	641616707
Product	peptide ABC transporter, ATP-binding protein SapD
Protein accession	YP_001743885
Protein GI	170679617
COG category	[V] Defense mechanisms
COG ID	[COG4170] ABC-type antimicrobial peptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.000565495
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCATTAC TCGATATTCG TAACCTGACC ATTGAATTTA AAACCGGTGA TGAGTGGGTT 
AAAGCCGTCG ACCGCGTAAG TATGACCTTA ACCGAAGGTG AAATCCGCGG TCTTGTTGGC 
GAATCAGGTT CCGGCAAAAG TTTGATTGCG AAAGCAATTT GTGGGGTGAA TAAAGATAAC 
TGGCGTGTTA CTGCTGACCG TATGCGTTTT GATGATATCG ATTTGCTGCG TCTCTCCGCA 
CGCGAACGGC GCAAGCTGGT TGGTCACAAC GTGTCGATGA TTTTCCAGGA ACCGCAGTCG 
TGTCTTGACC CTTCAGAACG TGTGGGTCGC CAGTTGATGC AAAACATCCC AGCCTGGACC 
TATAAAGGCC GTTGGTGGCA GCGTTTTGGC TGGCGCAAAC GCCGTGCCAT TGAACTGCTG 
CACCGCGTGG GGATTAAAGA TCACAAAGAT GCGATGCGCA GTTTTCCCTA TGAGTTGACC 
GAAGGTGAAT GTCAGAAAGT GATGATAGCC ATTGCACTGG CGAATCAACC GCGTCTGCTG 
ATTGCTGACG AACCGACAAA CTCAATGGAG CCAACAACCC AGGCGCAAAT CTTTCGCCTG 
CTGACGCGTC TCAACCAAAA CAGTAATACC ACTATTTTGC TTATCAGCCA TGACTTACAA 
ATGCTTAGCC AATGGGCGGA TAAAATTAAC GTGCTTTACT GCGGTCAAAC GGTGGAAACC 
GCGCCAAGTA AGGAGTTGGT GACAATGCCA CATCATCCTT ATACCCAGGC GCTGATCCGC 
GCGATACCAG ACTTCGGCAG CGCGATGCCG CATAAAAGTC GCCTCAATAC GCTGCCCGGC 
GCTATCCCGC TGCTGGAACA GTTACCGATT GGGTGTCGTC TGGGGCCGCG TTGCCCGTAT 
GCACAACGAG AATGCATTGT GACGCCACGT TTGACGGGGG CGAAAAATCA TCTCTATGCC 
TGTCATTTCC CGCTGAACAT GGAGAAAGAA TGA

Protein sequence

MPLLDIRNLT IEFKTGDEWV KAVDRVSMTL TEGEIRGLVG ESGSGKSLIA KAICGVNKDN 
WRVTADRMRF DDIDLLRLSA RERRKLVGHN VSMIFQEPQS CLDPSERVGR QLMQNIPAWT 
YKGRWWQRFG WRKRRAIELL HRVGIKDHKD AMRSFPYELT EGECQKVMIA IALANQPRLL 
IADEPTNSME PTTQAQIFRL LTRLNQNSNT TILLISHDLQ MLSQWADKIN VLYCGQTVET 
APSKELVTMP HHPYTQALIR AIPDFGSAMP HKSRLNTLPG AIPLLEQLPI GCRLGPRCPY 
AQRECIVTPR LTGAKNHLYA CHFPLNMEKE