Gene Acid345_4334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4334
Symbol
ID	4071752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5142394
End bp	5143932
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	60%
IMG OID	637986367
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_593408
Protein GI	94971360
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00117083
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.611425
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAGA TTAAAGCAGA CGAAATTACA AAACTGATCC GGTCGCAGAT CGAGAACTAC 
GAGACCAAGA TCGCGGTGGA CGAAGTCGGC ACCGTGATGT CGATTGGCGA CGGCATTGCC 
CGCGTTTACG GCATTGATAA GGTCATGGCC GGCGAGCTAT TGGCCTTCCC GCACGGCGTG 
GCCGGAATCG CGATGAACCT GGATGAAGAC CAGGTGGGCG CGGTGCTGCT CGGCGAGTAC 
ACCGCGATCA AAGAGGGCGA CGAGGTTAAG CGCACGAAGC GGATTATGAG CGTGCCTGTC 
GGTGAGGCGA TGATTGGGCG GGTAGTGAAC GCGCTTGGTC AGCCGATTGA CGACAAGGGG 
CCGATCGTCA CCGACAAGTT CAATCCGGTG GAGCGCATTG CGCCGGGTGT GATTGATCGC 
CAGCCGGTGC GTGAACCGAT GGCGACAGGT TTGAAGGCGA TTGACGCGAT GATCCCGGTG 
GGCCGCGGTC AGCGCGAGCT GATCATTGGC GACCGCCAGA CCGGCAAGAC CGCGGTGGCG 
CTGGACACGA TCATCAACAG TAAGGGCAAG AACCTGATCT GCGTGTACGT TGCGATCGGC 
CAGAAGCGGT CGAGCGTGGC GCAGGTGGTG AAGATGCTGG AAGACAACGG CGCGATGGAG 
TACTCGATCG TGGTCGTCGC TTCGGCCAGC GACCCGGCGC CAATGCAGTA CATCGCTCCT 
TACTCCGGAA CGGCGATTGC CGAGTACTTC CGTGACAGCG GGCGTCACGC GCTGTGCATT 
TACGACGATC TGTCGAAGCA GGCTGCGGCG TACCGCGAAA TTTCGCTGCT GCTGCGGCGT 
CCACCGGGAC GCGAGGCGTA TCCGGGCGAC GTGTTTTATC TGCACAGCCG TTTGCTCGAG 
CGTTCGTCGA AACTGAGCGA TAAGTTGGGT GGCGGTTCGA TTACGGCACT GCCGATTATC 
GAAACGCAAG CGGGCGACGT TTCGGCGTAC ATTCCGACCA ACGTGATTTC GATTACCGAC 
GGCCAGATTT ACCTTGAAAC CGACTTGTTC AACTCGGGCG TGCGTCCGGC GGTGAACGTC 
GGTCTGTCGG TGAGCCGTGT GGGATTCTCG GCGGCGATCA AGGCGATGAA GCAGGTCGGC 
GCCAGTCTGA AGCTGGAACT TGCGCAGTAC CGCGAGTTGG CGGCGTTCTC GCAGTTCGGC 
AGCGACCTGG ACAAGGCGAC GCAAGCACAG TTGAATCGTG GCCAGCGCCT GGTGGAGATC 
CTGAAGCAGG ACCAGTTCCA GCCGCTTCCG TTCTCGAAGC AGATCACGAT CATCTTCGCC 
GGAACCAACG GGCTTCTCGA TGATCTCGAA GTGAAGGACG TTCGTCCGTT CGAGAAAGCG 
CTCTATGAAT ACGTGGAGAG CGCGAACCCG CAGTTGTTCC GCACGATCGA AGAGAAGAAA 
GCGCTCGACG ATGCGATTAA GGCGGACATG ACGAAGACGA TCAAGGAAGC CAAAGAGCGT 
TTCTTGTCGG ATCGCAAGGC GGCGAAGGCC GGGGCGTAA

Protein sequence

MAQIKADEIT KLIRSQIENY ETKIAVDEVG TVMSIGDGIA RVYGIDKVMA GELLAFPHGV 
AGIAMNLDED QVGAVLLGEY TAIKEGDEVK RTKRIMSVPV GEAMIGRVVN ALGQPIDDKG 
PIVTDKFNPV ERIAPGVIDR QPVREPMATG LKAIDAMIPV GRGQRELIIG DRQTGKTAVA 
LDTIINSKGK NLICVYVAIG QKRSSVAQVV KMLEDNGAME YSIVVVASAS DPAPMQYIAP 
YSGTAIAEYF RDSGRHALCI YDDLSKQAAA YREISLLLRR PPGREAYPGD VFYLHSRLLE 
RSSKLSDKLG GGSITALPII ETQAGDVSAY IPTNVISITD GQIYLETDLF NSGVRPAVNV 
GLSVSRVGFS AAIKAMKQVG ASLKLELAQY RELAAFSQFG SDLDKATQAQ LNRGQRLVEI 
LKQDQFQPLP FSKQITIIFA GTNGLLDDLE VKDVRPFEKA LYEYVESANP QLFRTIEEKK 
ALDDAIKADM TKTIKEAKER FLSDRKAAKA GA