Gene EcSMS35_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4100
Symbol	atpD
ID	6147121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4195792
End bp	4197174
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	55%
IMG OID	641618924
Product	F0F1 ATP synthase subunit beta
Protein accession	YP_001746062
Protein GI	170681189
COG category	[C] Energy production and conversion
COG ID	[COG0055] F0F1-type ATP synthase, beta subunit
TIGRFAM ID	[TIGR01039] ATP synthase, F1 beta subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.740687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.359635
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTACTG GAAAGATTGT CCAGGTAATC GGCGCCGTAG TTGACGTCGA ATTCCCTCAG 
GATGCCGTAC CGCGCGTGTA CGATGCTCTT GAGGTGCAAA ATGGTAATGA GCGTCTGGTG 
CTGGAAGTTC AGCAGCAGCT CGGCGGCGGT ATCGTGCGTA CCATCGCAAT GGGTTCCTCC 
GACGGTCTGC GTCGCGGTCT GGATGTAAAA GACCTCGAAC ACCCGATCGA AGTCCCGGTA 
GGTAAAGCGA CTCTGGGCCG TATCATGAAC GTACTGGGTG AACCGGTCGA CATGAAAGGC 
GAGATCGGTG AAGAAGAGCG TTGGGCGATT CACCGCGCAG CACCTTCCTA CGAAGAGCTG 
TCAAACTCTC AGGAACTGCT GGAAACCGGT ATCAAAGTTA TCGACCTGAT GTGTCCGTTC 
GCTAAGGGCG GTAAAGTTGG TCTGTTCGGT GGTGCGGGTG TAGGTAAAAC CGTAAACATG 
ATGGAGCTTA TTCGTAACAT CGCGATCGAG CACTCCGGAT ACTCTGTGTT TGCGGGCGTA 
GGTGAACGTA CTCGTGAGGG TAACGACTTC TACCACGAAA TGACCGACTC CAACGTTATC 
GACAAAGTAT CCCTGGTGTA TGGCCAGATG AACGAGCCGC CGGGAAACCG TCTGCGCGTT 
GCTCTGACCG GTCTGACCAT GGCTGAGAAA TTCCGTGACG AAGGTCGTGA CGTTCTGCTG 
TTCGTTGACA ACATCTATCG TTACACCCTG GCCGGTACGG AAGTATCCGC ACTGCTGGGC 
CGTATGCCTT CAGCGGTAGG TTATCAGCCG ACCCTGGCGG AAGAGATGGG CGTTCTGCAG 
GAACGTATCA CCTCCACCAA AACTGGTTCT ATCACCTCCG TACAGGCGGT ATACGTACCT 
GCGGATGACT TGACTGACCC GTCTCCGGCA ACCACCTTTG CGCACCTTGA CGCAACCGTG 
GTACTGAGCC GTCAGATCGC GTCTCTGGGT ATCTACCCGG CCGTTGACCC GCTGGACTCC 
ACCAGCCGTC AGCTGGACCC GCTGGTGGTT GGTCAGGAAC ACTACGACAC CGCGCGTGGC 
GTTCAGTCCA TCCTGCAACG TTATCAGGAA CTGAAAGACA TCATCGCCAT CCTGGGTATG 
GATGAACTGT CTGAAGAAGA CAAACTGGTG GTAGCGCGTG CTCGTAAGAT CCAGCGCTTC 
CTGTCCCAGC CGTTCTTCGT GGCAGAAGTA TTCACCGGTT CTCCGGGTAA ATACGTCTCC 
CTGAAAGACA CCATCCGTGG CTTTAAAGGC ATCATGGAAG GCGAATACGA TCACCTGCCG 
GAGCAGGCGT TCTACATGGT CGGTTCCATC GAAGAAGCTG TGGAAAAAGC CAAAAAACTT 
TAA

Protein sequence

MATGKIVQVI GAVVDVEFPQ DAVPRVYDAL EVQNGNERLV LEVQQQLGGG IVRTIAMGSS 
DGLRRGLDVK DLEHPIEVPV GKATLGRIMN VLGEPVDMKG EIGEEERWAI HRAAPSYEEL 
SNSQELLETG IKVIDLMCPF AKGGKVGLFG GAGVGKTVNM MELIRNIAIE HSGYSVFAGV 
GERTREGNDF YHEMTDSNVI DKVSLVYGQM NEPPGNRLRV ALTGLTMAEK FRDEGRDVLL 
FVDNIYRYTL AGTEVSALLG RMPSAVGYQP TLAEEMGVLQ ERITSTKTGS ITSVQAVYVP 
ADDLTDPSPA TTFAHLDATV VLSRQIASLG IYPAVDPLDS TSRQLDPLVV GQEHYDTARG 
VQSILQRYQE LKDIIAILGM DELSEEDKLV VARARKIQRF LSQPFFVAEV FTGSPGKYVS 
LKDTIRGFKG IMEGEYDHLP EQAFYMVGSI EEAVEKAKKL