Gene Franean1_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1024
Symbol
ID	5669438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1204613
End bp	1206052
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	641239953
Product	F0F1 ATP synthase subunit beta
Protein accession	YP_001505386
Protein GI	158312878
COG category	[C] Energy production and conversion
COG ID	[COG0055] F0F1-type ATP synthase, beta subunit
TIGRFAM ID	[TIGR01039] ATP synthase, F1 beta subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCA CCACCAGCTC GCCGACCACG GCGGAGGGCC GGACTCCGGG GATCGGCCGA 
GTCGCCCGAG TCATCGGACC GGTCGTCGAC GTCGAGTTCG CCCCCGACGA GCTTCCCGAG 
ATCTACACCG CGCTGCACGT CGACCGCACG ATCGACGGCG AGACCGCGGT CCTGACCCTT 
GAGGTCGCGC AGCACATCGG CGACAACACC ATCCGCGCCA TCTCCATGCA GCAGACCGAC 
GGCCTCGTGC GCGGGGCTCC GGTCCGCGAC ACCGGCGCGC CGATCTCCGT CCCGGTCGGG 
AACGCCACCA AGGGCCACGT GTTCAACGTG CTCGGCAACC CGCTCGACGT GGACAAGGTC 
GACGCCGAGA CCTACTGGCC GATCCACCGC TCGGCGCCGG CCTTCGACCA GCTCGAGTCG 
AAGACGGAGA TGTTCACCAC CGGCATCAAG GTCATCGACC TGCTCGCCCC GTACGTGCGA 
GGCGGCAAGA TCGGTCTGAT GGGCGGCGCC GGCGTCGGCA AGACCGTCAT CATCCAGGAG 
ATGATCCGCC GGGTCGCCAA GGAGTTCGGT GGCGTGTCGG TGTTCGCCGG CGTCGGCGAG 
CGCACCCGCG AGGGCAACGA CCTGTTCCTG GAGATGACCG AGGCCGGCGT CATCGAGGAC 
ACCGCGCTCG TCTTCGGCCA GATGGACGAG CCGCCCGGCA CCCGGCTCCG GGTCGCCCTC 
GGCGCGCTCA CCATGGCCGA GTACTTCCGG GATGTGCAGA AGCAGGACGT GCTCCTGTTC 
ATCGACAACA TCTTCCGGTT CACCCAGGCC GGCTCCGAGG TGTCGACGCT GCTCGGCCGG 
ATGCCCAGCG CCGTCGGCTA CCAGCCGACG CTGGCTGACG AGATGGGCGC CCTGCAGGAG 
CGGATCACCT CGACCCGCGG TCACTCGATC ACCTCGCTGC AGGCGATCTA CGTCCCCGCG 
GACGACCTGA CCGACCCGGC CCCGGCGACG ACGTTCACCC ACCTCGACGC CAACACGGTG 
CTCGACCGGG CGATCTCCGA CCTCGGCATC TACCCGGCCG TGAGCCCGCT GGACTCGAAC 
TCCCGGATCC TTGACGCCCG GTACATCGGG CAGGAGCACT ACGACACCGC CCGCGAGGTG 
CAGCGGATCC TGCAGCGCTA CAAGGACCTG CAGGACATCA TCGCCATCCT CGGCATCGAC 
GAGCTCTCCG AAGAGGACAA GATCCTCGTC AACCGGGCCC GCCGGATCCA GCGGTTCCTG 
TCCCAGCCGT TCTTCGTCGC CGAGCAGTTC ACTGGCATCC CCGGCAAGTT CGTCCCGCTC 
GACGAGACGA TCGACTCGTT CCGCCGGCTC ACCCAGGGTG ACTACGACCA CCTGCCCGAG 
CAGGCGTTCT TCATGTGCGG CGGGATCGAG GACGCCGAGA AGAACGCGGA GAACCTGTAA

Protein sequence

MTVTTSSPTT AEGRTPGIGR VARVIGPVVD VEFAPDELPE IYTALHVDRT IDGETAVLTL 
EVAQHIGDNT IRAISMQQTD GLVRGAPVRD TGAPISVPVG NATKGHVFNV LGNPLDVDKV 
DAETYWPIHR SAPAFDQLES KTEMFTTGIK VIDLLAPYVR GGKIGLMGGA GVGKTVIIQE 
MIRRVAKEFG GVSVFAGVGE RTREGNDLFL EMTEAGVIED TALVFGQMDE PPGTRLRVAL 
GALTMAEYFR DVQKQDVLLF IDNIFRFTQA GSEVSTLLGR MPSAVGYQPT LADEMGALQE 
RITSTRGHSI TSLQAIYVPA DDLTDPAPAT TFTHLDANTV LDRAISDLGI YPAVSPLDSN 
SRILDARYIG QEHYDTAREV QRILQRYKDL QDIIAILGID ELSEEDKILV NRARRIQRFL 
SQPFFVAEQF TGIPGKFVPL DETIDSFRRL TQGDYDHLPE QAFFMCGGIE DAEKNAENL