Gene Franean1_1546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1546
Symbol
ID	5669949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1846979
End bp	1848034
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	71%
IMG OID	641240465
Product	putative esterase
Protein accession	YP_001505891
Protein GI	158313383
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2382] Enterochelin esterase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.828639
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.764024
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTTCGG CACTGGGTTC GCTGGTCATC GTCGCGACGT GGTTCCTGTT GGTCCTCGGG 
GCGCTGTCGG CGATCTGCTG GGCGGGCTGC GTGTGGATGA CCCGCCGACG GCGGGCCATG 
GCCGTCGGGC TGGGCTTCCT GGCCGCGCTG CTCACGCTGG CGACGGCGGC GGACACCGCC 
AACGCCCACT ACGGCTATCT GCCACGGGCC GCTGACGTCC TCGGGCTGAC CTCCTGGCCG 
ACCGCGTCGG TGCGCGAGGT CGTCGGCCCG GCGCCGCGGC CGCATCCCGA CGGCGCGGTC 
GTCCACCTGC CGATCGCCGG CGTTCACAGC GGGTTCGGTA CCCACAGCGC ACTGGTGTAC 
GTCCCGCCGC AGTATTTCAC CGACCCGGGC GCCCGATTCC CGGTCGTCTA TCTTTTCCAC 
GGCTCCCCGG GAATTCCGCT CGACTGGTAC CGGGCGGGGC AGGCGGCGAA GACCGGCGCG 
GCCCTGGCAC GCGCGGGCCG GCCCGCGATC CTCGTCGCCC CGCCGCTGGG TCATGGCTGG 
CTCGATGACA GTGAGTGCGT CGACCGTCCC GGGGAACGGA TCGAGACCTA CCTCGTCGAC 
GATGTTCTCC CGACCGTCGA CAATCTCCTG CGCGCCATTC CCGACCGGGC GGACCGCGTC 
TTCGCCGGGA TATCCGCGGG CGGTTTCTGC GCGCTGAACC TCGGGCTGCG CCACCGCGAT 
CTCGTCGGGA CGATCGTGGA CATCTCCGGG TTGGCGAGGC CGACCCATTC CGGCGGAATG 
ACCGGCCTTT TCGGGAATCG TCCGGACCTC GCCGCCGTCA CCGCGGCCAA CACCCCGGAA 
AGCTATTCCG CGACGCTGCC GCCGAATCCA CCGACCCGGG TCTGGCTGAG CTGTGGACTC 
ATGGACTTCG GGCCGCTCGG CGACATCAGG AAAATGGCGC TGGCCCTGTA CGGACGGCCC 
GGATTCACCA CCGTGCTGCG CCCGCGGCCC GGCGGCCACG ACTTCGGCGT CTGGCGGCCC 
GCACTGCGCG ACGGCCTGCG CTGGGCGTTC CCCTGA

Protein sequence

MGSALGSLVI VATWFLLVLG ALSAICWAGC VWMTRRRRAM AVGLGFLAAL LTLATAADTA 
NAHYGYLPRA ADVLGLTSWP TASVREVVGP APRPHPDGAV VHLPIAGVHS GFGTHSALVY 
VPPQYFTDPG ARFPVVYLFH GSPGIPLDWY RAGQAAKTGA ALARAGRPAI LVAPPLGHGW 
LDDSECVDRP GERIETYLVD DVLPTVDNLL RAIPDRADRV FAGISAGGFC ALNLGLRHRD 
LVGTIVDISG LARPTHSGGM TGLFGNRPDL AAVTAANTPE SYSATLPPNP PTRVWLSCGL 
MDFGPLGDIR KMALALYGRP GFTTVLRPRP GGHDFGVWRP ALRDGLRWAF P