Gene Athe_1426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1426
Symbol
ID	7409169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1507808
End bp	1509331
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	40%
IMG OID	643715789
Product	ATP synthase F1, alpha subunit
Protein accession	YP_002573297
Protein GI	222529415
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGATG TAACAATTAG ACCAGATGAA ATTGCTTCAA TTATAAAAGA GCAAATTAAA 
AATTATGAAA AAAAGATTGA CACAAGTGAT GTCGGTGTTG TCATAATGTC AGGTGACGGT 
ATTGCAAGAA TACATGGTCT TGACAACTGC ATGGCTGGTG AACTTTTAGA ATTTCCTAAT 
GGAGTTTATG GAATGGCTCT CAATTTAGAA GAGGACAATG TTGGATGTGT CATACTTGGA 
AATGATAAAG AAATAAAGGA AGGTACCATT GTAAAAAGGA CAGGTAGAGT TGTTGAGGTG 
CCTGTAGGAG AAGAACTTTT AGGAAGAGTT GTAAACGCTC TGGGACAACC TATAGATGGT 
CTTGGGCCCA TCAATGCCAA AAAGTTTAGA CCAGTAGAAA GAATAGCACC TGGCGTAATA 
GAAAGAGAAC CTGTTAACAC GCCTCTTCAG ACAGGTATAA TGGCTATTGA CGCTATGATT 
CCTATAGGAA GAGGGCAAAG AGAGCTTATA ATTGGTGATA GGCAAACGGG TAAAACTGCA 
ATTGCAATAG ATACGATTAT AAACCAGAAA GATCAGGGTG TTTATTGCAT CTATGTGGCA 
ATTGGGCAAA AGGCCTCTAC AGTTGCTCAG ATAGTCAATA CCTTAAAAGA ATACGGTGCG 
ATGGATTATA CCATTGTTGT TAGTGCAACT GCAAGTGATT CTGCTCCTCT TCAATTCTTA 
GCTCCATACG CAGGTTGCGC GATGGGAGAA GAGTTTATGG AGTCGGGCAA AGACGCACTC 
ATTATATACG ATGACCTTTC TAAACACGCT GTTGCATACA GGGCAATGTC TCTTTTACTA 
AGACGTCCAC CTGGAAGAGA AGCTTATCCT GGTGATGTGT TTTACTTACA TTCAAGACTT 
TTGGAAAGAG CGGCAAAACT GAATGCTCAG CGTGGAGGCG GATCTCTTAC CGCACTGCCA 
ATAATAGAAA CTCAAGCAGG TGACGTTTCA GCATATATTC CTACAAATGT CATTTCAATT 
ACAGATGGGC AGATATACCT TGAAAGTGAA TTATTCTACG CAGGGGTAAG ACCTGCGATA 
AATGCTGGAA TATCAGTGTC AAGAGTTGGT GGGAAAGCTC AGACAAAAGC TATGAAAAAG 
GTTGCAGGAA GGTTAAGGCT TGATCTTGCT CAGTACCGTG AGCTTGAGGC TTTTGCTCAG 
TTTGGTTCAG AACTTGATAA GTCAACGCGA GAAAGGCTTG CTCAGGGACA AAGAATTGTA 
GAGACGTTAA AACAGCCACA GTACAAGCCG CTTCCTGTAT GGCATCAGGT GGTGATTTTG 
TACAGTGCAA TAAATGGTTA TCTGATGGAT ATAGAAGTTT CAAAGGTCAG GGAATTTAAT 
GAGAAGCTTG TACAGTATAT ATCAGCAAAC TATCCCCAGA TATTTGATTC TATAAAAGAG 
ACAAAGGATT TGACACCTGA AACAGAAGAG CTTTTGAAGA AGGTCATAGT AGAGATAAAA 
GAGAGATTTA AGAGTAACAA GTAG

Protein sequence

MIDVTIRPDE IASIIKEQIK NYEKKIDTSD VGVVIMSGDG IARIHGLDNC MAGELLEFPN 
GVYGMALNLE EDNVGCVILG NDKEIKEGTI VKRTGRVVEV PVGEELLGRV VNALGQPIDG 
LGPINAKKFR PVERIAPGVI EREPVNTPLQ TGIMAIDAMI PIGRGQRELI IGDRQTGKTA 
IAIDTIINQK DQGVYCIYVA IGQKASTVAQ IVNTLKEYGA MDYTIVVSAT ASDSAPLQFL 
APYAGCAMGE EFMESGKDAL IIYDDLSKHA VAYRAMSLLL RRPPGREAYP GDVFYLHSRL 
LERAAKLNAQ RGGGSLTALP IIETQAGDVS AYIPTNVISI TDGQIYLESE LFYAGVRPAI 
NAGISVSRVG GKAQTKAMKK VAGRLRLDLA QYRELEAFAQ FGSELDKSTR ERLAQGQRIV 
ETLKQPQYKP LPVWHQVVIL YSAINGYLMD IEVSKVREFN EKLVQYISAN YPQIFDSIKE 
TKDLTPETEE LLKKVIVEIK ERFKSNK