Gene Dshi_2936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2936
Symbol	atpA1
ID	5710787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3092718
End bp	3094256
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	65%
IMG OID	641268862
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_001534270
Protein GI	159045476
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.147396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0629902
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAATCC AAGCTGCCGA AATCTCTGCG ATCCTCAAGG AGCAGATCAA GAACTTTGGC 
CAGGAAGCCG AAGTCGCCGA GGTGGGCCGC GTGCTCAGCG TCGGCGACGG GATTGCACGG 
GTCCACGGGC TGGACAACGT GCAGGCCGGT GAAATGGTCG AGTTCCCGGG CGGCATCCGC 
GGGATGGCCC TGAACCTCGA AATCGACAAT GTGGGTGTCG TGATCTTCGG CTCGGACCGG 
GACATCAAGG AAGGCGACAT CGTCAAGCGC ACCAAGTCCA TCGTGGACGT GCCCGTGGGC 
GACGCGCTGC TGGGCCGGGT CGTGGATGGC CTGGGCAACC CGCTGGACGG CAAGGGCCCG 
ATCGAGACCA CCGAGCGCAG CATCGCGGAC GTGAAGGCGC CGGGCATCAT CCCGCGCAAA 
TCCGTGCATG AGCCGATGGC GACCGGCCTG AAATCTGTCG ACGCCATGAT CCCGATCGGG 
CGCGGCCAGC GCGAGCTGAT CATCGGCGAC CGCCAGACCG GCAAGACCGC CGTGGCGCTC 
GACACGATCC TGAACCAGAA GGCCTATAAC GACGCCGCCG GCGACGACGA GAGCAAGAAG 
CTCTACTGCG TCTACGTGGC CGTGGGGCAG AAGCGCTCCA CCGTGGCGCA GCTGGTCAAG 
AAGCTCGAAG AAACTGGTGC CATCGAATAC TCCATCGTCG TGGCCGCCAC CGCCTCCGAC 
CCGGCGCCGA TGCAGTTCCT CGCACCCTAT GCCGCGACCT CCATGGCGGA ATTCTTCCGC 
GACAATGGCC GCCATGCGCT GATCATCTAT GATGACCTCT CGAAGCAGGC CGTGTCTTAC 
CGTCAGATGT CGCTGCTGCT GCGTCGCCCG CCGGGCCGCG AAGCCTATCC GGGCGACGTG 
TTCTACCTGC ACTCCCGCCT GCTGGAGCGG TCGGCGAAGC TGGGCGACGA TCATGGCAAC 
GGGTCGCTGA CCGCGCTGCC GATCATCGAA ACGCAAGGCG GCGACGTGTC GGCCTTTATC 
CCGACCAACG TGATCTCGAT CACCGACGGC CAGATCTTCC TGGAAACCGA GCTGTTCTAC 
CAGGGCATCC GCCCCGCCGT GAACACCGGT CTGTCGGTGT CGCGCGTGGG CTCCTCGGCC 
CAGACCAACG CGATGAAATC CGTCGCTGGC CCGGTGAAGC TGGAACTGGC GCAGTACCGC 
GAAATGGCGG CCTTCGCGCA GTTCGGCTCC GACCTCGACG CCGCCACACA GCAGCTGCTG 
AACCGTGGTG CGCGCCTGAC CGAGCTGATG AAGCAGCCGC AATACTCGCC GCTGACCAAT 
GCCGAGATCG TCTGCGTGAT CTTCGCCGGC ACCAAGGGCT ACCTCGACAA GATCCCCGTG 
GGGGACGTGG GCCGTTACGA GAAGGGCCTG CTGGCGCACC TGCGCGGCAA GCACAAGGGC 
CTGCTGGACT ACATCACCAA GGAAGATCCC AAGATCAAGG GTGAGGCCGA AGACAAGATC 
CGCGCAGCGC TCGACGAATT CGCCGCGACC TTCGCGTAA

Protein sequence

MGIQAAEISA ILKEQIKNFG QEAEVAEVGR VLSVGDGIAR VHGLDNVQAG EMVEFPGGIR 
GMALNLEIDN VGVVIFGSDR DIKEGDIVKR TKSIVDVPVG DALLGRVVDG LGNPLDGKGP 
IETTERSIAD VKAPGIIPRK SVHEPMATGL KSVDAMIPIG RGQRELIIGD RQTGKTAVAL 
DTILNQKAYN DAAGDDESKK LYCVYVAVGQ KRSTVAQLVK KLEETGAIEY SIVVAATASD 
PAPMQFLAPY AATSMAEFFR DNGRHALIIY DDLSKQAVSY RQMSLLLRRP PGREAYPGDV 
FYLHSRLLER SAKLGDDHGN GSLTALPIIE TQGGDVSAFI PTNVISITDG QIFLETELFY 
QGIRPAVNTG LSVSRVGSSA QTNAMKSVAG PVKLELAQYR EMAAFAQFGS DLDAATQQLL 
NRGARLTELM KQPQYSPLTN AEIVCVIFAG TKGYLDKIPV GDVGRYEKGL LAHLRGKHKG 
LLDYITKEDP KIKGEAEDKI RAALDEFAAT FA