Gene EcHS_A3948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3948
Symbol	atpD
ID	5591041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3943172
End bp	3944554
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	55%
IMG OID	640923055
Product	F0F1 ATP synthase subunit beta
Protein accession	YP_001460532
Protein GI	157163214
COG category	[C] Energy production and conversion
COG ID	[COG0055] F0F1-type ATP synthase, beta subunit
TIGRFAM ID	[TIGR01039] ATP synthase, F1 beta subunit

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	0.440283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACTG GAAAGATTGT CCAGGTAATC GGCGCCGTAG TTGACGTCGA ATTCCCTCAG 
GATGCCGTAC CGCGCGTGTA CGATGCTCTT GAGGTGCAAA ATGGTAGTGA GCGTCTGGTG 
CTGGAAGTTC AGCAGCAGCT CGGCGGCGGT ATCGTACGTA CCATCGCAAT GGGTTCCTCC 
GACGGTCTGC GTCGCGGTCT GGATGTAAAA GACCTCGAAC ACCCGATTGA AGTCCCGGTA 
GGTAAAGCGA CTCTGGGCCG TATCATGAAC GTACTGGGTG AACCGGTCGA CATGAAAGGC 
GAGATCGGTG AAGAAGAGCG TTGGGCGATT CACCGCGCAG CACCTTCCTA CGAAGAGCTG 
TCAAACTCTC AGGAACTGCT GGAAACCGGT ATCAAAGTTA TCGACCTGAT GTGTCCGTTC 
GCTAAGGGCG GTAAAGTTGG TCTGTTCGGT GGTGCGGGTG TAGGTAAAAC CGTAAACATG 
ATGGAGCTCA TTCGTAACAT CGCGATCGAG CACTCCGGTT ACTCTGTGTT TGCGGGCGTA 
GGTGAACGTA CTCGTGAGGG TAACGACTTC TACCACGAAA TGACCGACTC CAACGTTATC 
GACAAAGTAT CCCTGGTGTA TGGCCAGATG AACGAGCCGC CGGGAAACCG TCTGCGCGTT 
GCTCTGACCG GTCTGACCAT GGCTGAGAAA TTCCGTGACG AAGGTCGTGA CGTTCTGCTG 
TTCGTTGACA ACATCTATCG TTACACCCTG GCCGGTACGG AAGTATCCGC ACTGCTGGGC 
CGTATGCCTT CAGCGGTAGG TTATCAGCCG ACCCTGGCGG AAGAGATGGG CGTTCTGCAG 
GAACGTATCA CCTCCACCAA AACTGGTTCT ATCACCTCCG TACAGGCAGT ATACGTACCT 
GCGGATGACT TGACTGACCC GTCTCCGGCA ACCACCTTTG CGCACCTTGA CGCAACCGTG 
GTACTGAGCC GTCAGATCGC GTCTCTGGGT ATCTACCCGG CCGTTGACCC GCTGGACTCC 
ACCAGCCGTC AGCTGGACCC GCTGGTGGTT GGTCAGGAAC ACTACGACAC CGCGCGTGGC 
GTTCAGTCCA TCCTGCAACG TTATCAGGAA CTGAAAGACA TCATCGCCAT CCTGGGTATG 
GATGAACTGT CTGAAGAAGA CAAACTGGTG GTAGCGCGTG CTCGTAAGAT CCAGCGCTTC 
CTGTCCCAGC CGTTCTTCGT GGCAGAAGTA TTCACCGGTT CTCCGGGTAA ATACGTCTCC 
CTGAAAGACA CCATCCGTGG CTTTAAAGGC ATCATGGAAG GCGAATACGA TCACCTGCCG 
GAGCAGGCGT TCTACATGGT CGGTTCCATC GAAGAAGCTG TGGAAAAAGC CAAAAAACTT 
TAA

Protein sequence

MATGKIVQVI GAVVDVEFPQ DAVPRVYDAL EVQNGSERLV LEVQQQLGGG IVRTIAMGSS 
DGLRRGLDVK DLEHPIEVPV GKATLGRIMN VLGEPVDMKG EIGEEERWAI HRAAPSYEEL 
SNSQELLETG IKVIDLMCPF AKGGKVGLFG GAGVGKTVNM MELIRNIAIE HSGYSVFAGV 
GERTREGNDF YHEMTDSNVI DKVSLVYGQM NEPPGNRLRV ALTGLTMAEK FRDEGRDVLL 
FVDNIYRYTL AGTEVSALLG RMPSAVGYQP TLAEEMGVLQ ERITSTKTGS ITSVQAVYVP 
ADDLTDPSPA TTFAHLDATV VLSRQIASLG IYPAVDPLDS TSRQLDPLVV GQEHYDTARG 
VQSILQRYQE LKDIIAILGM DELSEEDKLV VARARKIQRF LSQPFFVAEV FTGSPGKYVS 
LKDTIRGFKG IMEGEYDHLP EQAFYMVGSI EEAVEKAKKL