Gene EcSMS35_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1689
Symbol
ID	6145414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1693132
End bp	1694118
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	54%
IMG OID	641616565
Product	ABC transporter, ATP-binding protein
Protein accession	YP_001743743
Protein GI	170681718
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.20752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAAC CCGTTCTGGA CATTCAACAA CTGCATTTGA GTTTCCCCGG TTTTAACGGC 
GACGTTCACG CGCTCAACAA TGTGTCATTG AAAATCAACC GCGGTGAAAT TGTCGGTCTG 
GTGGGAGAAT CCGGCTCGGG TAAATCAGTC ACTGCAATGT TGATTATGCG TCTGCTACCG 
ACGGGCAGTT ATTGCGTACA TCGGGGACAT ATTTCACTGC TGGGAGAAGA TGTTCTTAAC 
GCTCGGGAAA AGCAGCTTCG TCAGTGGCGC GGCGCACGAG TGGCGATGAT CTTTCAGGAA 
CCGATGACCG CCCTCAATCC GACACGTCGA ATAGGTCTTC AGATGATGGA CGTGATCCGC 
CATCATCAAC CAATAAGTCG TCGGGAAGCC AGAGCTAAAG CGATTGCCCT GCTGGAAGAG 
ATGCAAATCC CGGATGCCGT GGAAGTTATG TCGCGCTATC CGTTTGAGCT TTCAGGTGGT 
ATGCGCCAGC GGGTAATGAT TGCGCTGGCA TTCTCCTGCG AGCCGCAATT GATTATTGCC 
GACGAACCGA CTACGGCGCT GGACGTCACG GTACAGTTGC AGGTACTGCG TCTGCTTAAA 
CATAAAGCCC GCGCCAGTGG AACTGCGGTA CTGTTCATCA GCCATGATAT GGCCGTGGTG 
TCGCAACTGT GCGATAGCGT TTACGTGATG TATGCCGGAA GCGTGATTGA GAGCGGCGTG 
ACGGCAGACG TTATCCATCA TCCCCGGCAT CCGTATACCA TTGGTTTGCT GCAATGCGCA 
CCGGAACATG GAATACCGCG CCAGCCATTA CCCGCTATTC CGGGGACGGT ACCAAACCTC 
ACCCATTTGC CTGACGGCTG CGCTTTTCGC GATCGTTGCT ATGCGGCAGG TACACAGTGT 
GAAAACGTCC CGGCGCTGAC AGCGTGTGGT GACAACAACC ACCGCTGCGC CTGTTGGTAT 
CCGCAGCAGG AGGTCATTAG TGTCTGA

Protein sequence

MTQPVLDIQQ LHLSFPGFNG DVHALNNVSL KINRGEIVGL VGESGSGKSV TAMLIMRLLP 
TGSYCVHRGH ISLLGEDVLN AREKQLRQWR GARVAMIFQE PMTALNPTRR IGLQMMDVIR 
HHQPISRREA RAKAIALLEE MQIPDAVEVM SRYPFELSGG MRQRVMIALA FSCEPQLIIA 
DEPTTALDVT VQLQVLRLLK HKARASGTAV LFISHDMAVV SQLCDSVYVM YAGSVIESGV 
TADVIHHPRH PYTIGLLQCA PEHGIPRQPL PAIPGTVPNL THLPDGCAFR DRCYAAGTQC 
ENVPALTACG DNNHRCACWY PQQEVISV