Gene EcDH1_4235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4235
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4597094
End bp	4598476
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	55%
IMG OID
Product	ATP synthase F1, beta subunit
Protein accession	ACX41833
Protein GI	260451411
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACTG GAAAGATTGT CCAGGTAATC GGCGCCGTAG TTGACGTCGA ATTCCCTCAG 
GATGCCGTAC CGCGCGTGTA CGATGCTCTT GAGGTGCAAA ATGGTAATGA GCGTCTGGTG 
CTGGAAGTTC AGCAGCAGCT CGGCGGCGGT ATCGTACGTA CCATCGCAAT GGGTTCCTCC 
GACGGTCTGC GTCGCGGTCT GGATGTAAAA GACCTCGAAC ACCCGATTGA AGTCCCGGTA 
GGTAAAGCGA CTCTGGGCCG TATCATGAAC GTACTGGGTG AACCGGTCGA CATGAAAGGC 
GAGATCGGTG AAGAAGAGCG TTGGGCGATT CACCGCGCAG CACCTTCCTA CGAAGAGCTG 
TCAAACTCTC AGGAACTGCT GGAAACCGGT ATCAAAGTTA TCGACCTGAT GTGTCCGTTC 
GCTAAGGGCG GTAAAGTTGG TCTGTTCGGT GGTGCGGGTG TAGGTAAAAC CGTAAACATG 
ATGGAGCTCA TTCGTAACAT CGCGATCGAG CACTCCGGTT ACTCTGTGTT TGCGGGCGTA 
GGTGAACGTA CTCGTGAGGG TAACGACTTC TACCACGAAA TGACCGACTC CAACGTTATC 
GACAAAGTAT CCCTGGTGTA TGGCCAGATG AACGAGCCGC CGGGAAACCG TCTGCGCGTT 
GCTCTGACCG GTCTGACCAT GGCTGAGAAA TTCCGTGACG AAGGTCGTGA CGTTCTGCTG 
TTCGTTGACA ACATCTATCG TTACACCCTG GCCGGTACGG AAGTATCCGC ACTGCTGGGC 
CGTATGCCTT CAGCGGTAGG TTATCAGCCG ACCCTGGCGG AAGAGATGGG CGTTCTGCAG 
GAACGTATCA CCTCCACCAA AACTGGTTCT ATCACCTCCG TACAGGCAGT ATACGTACCT 
GCGGATGACT TGACTGACCC GTCTCCGGCA ACCACCTTTG CGCACCTTGA CGCAACCGTG 
GTACTGAGCC GTCAGATCGC GTCTCTGGGT ATCTACCCGG CCGTTGACCC GCTGGACTCC 
ACCAGCCGTC AGCTGGACCC GCTGGTGGTT GGTCAGGAAC ACTACGACAC CGCGCGTGGC 
GTTCAGTCCA TCCTGCAACG TTATCAGGAA CTGAAAGACA TCATCGCCAT CCTGGGTATG 
GATGAACTGT CTGAAGAAGA CAAACTGGTG GTAGCGCGTG CTCGTAAGAT CCAGCGCTTC 
CTGTCCCAGC CGTTCTTCGT GGCAGAAGTA TTCACCGGTT CTCCGGGTAA ATACGTCTCC 
CTGAAAGACA CCATCCGTGG CTTTAAAGGC ATCATGGAAG GCGAATACGA TCACCTGCCG 
GAGCAGGCGT TCTACATGGT CGGTTCCATC GAAGAAGCTG TGGAAAAAGC CAAAAAACTT 
TAA

Protein sequence

MATGKIVQVI GAVVDVEFPQ DAVPRVYDAL EVQNGNERLV LEVQQQLGGG IVRTIAMGSS 
DGLRRGLDVK DLEHPIEVPV GKATLGRIMN VLGEPVDMKG EIGEEERWAI HRAAPSYEEL 
SNSQELLETG IKVIDLMCPF AKGGKVGLFG GAGVGKTVNM MELIRNIAIE HSGYSVFAGV 
GERTREGNDF YHEMTDSNVI DKVSLVYGQM NEPPGNRLRV ALTGLTMAEK FRDEGRDVLL 
FVDNIYRYTL AGTEVSALLG RMPSAVGYQP TLAEEMGVLQ ERITSTKTGS ITSVQAVYVP 
ADDLTDPSPA TTFAHLDATV VLSRQIASLG IYPAVDPLDS TSRQLDPLVV GQEHYDTARG 
VQSILQRYQE LKDIIAILGM DELSEEDKLV VARARKIQRF LSQPFFVAEV FTGSPGKYVS 
LKDTIRGFKG IMEGEYDHLP EQAFYMVGSI EEAVEKAKKL