Gene Franean1_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1022
Symbol
ID	5669436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1201863
End bp	1203524
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	69%
IMG OID	641239951
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_001505384
Protein GI	158312876
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAGC TGTCCATCCG GCCGGAGGAG ATCCGCGACG CCCTCCGGGA GTACGTCGAC 
TCCTTCCAGG CCACCTCCGG TGACCGGGAG GAGGTCGGCC GTGTCGTCGT GACCGGTGAC 
GGGATCGCGC GGGTCGAGGG CCTTCCGCAC ACCATGACCA ACGAGCTGCT GGAGTTCTCC 
GGCGGTGTGC TGGGACTGGC CCTCAACCTC GAGGTCGGCG AGATCGGCTG CGTCATCCTC 
GGCGACGCCG AGCACATCGA GGAGGGCCAG GAGGTCCGCC GGACCGGCGA GATCCTCGCC 
GTCCCGGTGG GCGACGGCTT CCTCGGCCGG GTCGTCGACC CGCTCGGGCG CCCGATCGAC 
GGCCTCGGTG ACATCGCCGC GGCCGGCACC CGGGCGCTCG AGCTGCAGGC CCCGTCTGTG 
GTGCAGCGCC AGCCCGTCAA GGAGCCGCTG CAGACCGGCA TCAAGGCCAT CGACGCGATG 
ACCGCCATCG GCCGGGGTCA GCGTCAGCTG ATCATCGGCG ACCGGCAGAC CGGGAAGACC 
ACCGTCGCGA TCGACGCGAT CATCAACCAG CGTGACAACT GGGCGAGCGG TGACCCGAAG 
AAGCAGGTCA AGTGCGTCTA CGTGGCCATC GGCCAGAAGA AGACGACCAT CCGCGAGGTG 
GTGAACACCC TCGAGGAGGC CGGCGCGCTG GCCTACACGA CGATCGTCGC CGCCCCGGCC 
GACCAGCCGG CGGGCTTCAA GTACATCGCC CCGTACACCG GCTCGGCGAT CGGGCAGTAC 
TGGATGTACA ACGGCCAGCA CTCGCTGGTG GTCTTCGACG ACCTCTCCAA GCAGGCCGAG 
GCGTACCGCG CGATCTCGCT GCTGCTTCGC CGCCCGCCGG GCCGTGAGGC ATACCCGGGC 
GACGTCTTCT ACTTGCACTC CCGTCTGCTG GAGCGCTGCG CGAAGCTCTC CGACGAGCTC 
GGGGGCGGGT CGCTGACCGG GCTGCCGATC ATCGAGACCA AGGCCAACGA CATCTCGGCC 
TACATCCCGA CGAACGTCAT CTCGATCACC GACGGCCAGA TCTTCCTGGA GTCGGACCTG 
TTCAACCAGG GCGTCCGCCC GGCGATCAAC GTCGGTACCT CGGTCTCCCG AGTGGGCGGC 
AGCGCGCAGG TCAAGGCGAT GAAGTCCGTC GCCGGCCGCC TGCGCCTCGA CCTGGCCCAG 
TACCGCGAGC TGGAGGCCTT CTCGGCCTTC GGCTCCGACC TGGACAAGGC CTCCCGCGAC 
CAGCTCGCCC GCGGTGCCCG GCTGGTGGAG CTGCTCAAGC AGCCCCAGAA CAAGCCGTTC 
TCCGTCGAGC GCCAGGTCGT GTCGATCTGG GCCGGCACCA CCGGCAAGCT GGACGACGTG 
CCGGTGGAGG ACATCCGCCG CTTCGAGGCC GAGTTCCTCG ACTTCGTCGG GCGGACCCAC 
GGCGCCATCT ACGACACCAT CGTGAACACC GGGAAGCTCG GTGACGACCT CGTCTCCTCC 
CTGGAGTCGG CCATCGCCGA GTTCAAGGAG CAGTTCACGC TGTCGAGCGG CAAGCAGCTG 
GTGAACGAGG CGGCTCCCGA GGCGCTCGAC CCGTCCGCGG TGGAGCGCGA GGAGATCGCC 
GTCCACCACC GCAAGCCGTC CGACGAGACC GCGGGTCACT GA

Protein sequence

MTELSIRPEE IRDALREYVD SFQATSGDRE EVGRVVVTGD GIARVEGLPH TMTNELLEFS 
GGVLGLALNL EVGEIGCVIL GDAEHIEEGQ EVRRTGEILA VPVGDGFLGR VVDPLGRPID 
GLGDIAAAGT RALELQAPSV VQRQPVKEPL QTGIKAIDAM TAIGRGQRQL IIGDRQTGKT 
TVAIDAIINQ RDNWASGDPK KQVKCVYVAI GQKKTTIREV VNTLEEAGAL AYTTIVAAPA 
DQPAGFKYIA PYTGSAIGQY WMYNGQHSLV VFDDLSKQAE AYRAISLLLR RPPGREAYPG 
DVFYLHSRLL ERCAKLSDEL GGGSLTGLPI IETKANDISA YIPTNVISIT DGQIFLESDL 
FNQGVRPAIN VGTSVSRVGG SAQVKAMKSV AGRLRLDLAQ YRELEAFSAF GSDLDKASRD 
QLARGARLVE LLKQPQNKPF SVERQVVSIW AGTTGKLDDV PVEDIRRFEA EFLDFVGRTH 
GAIYDTIVNT GKLGDDLVSS LESAIAEFKE QFTLSSGKQL VNEAAPEALD PSAVEREEIA 
VHHRKPSDET AGH