Gene Franean1_2496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2496
Symbol
ID	5670892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2973214
End bp	2974509
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	74%
IMG OID	641241413
Product	alpha/beta hydrolase fold
Protein accession	YP_001506834
Protein GI	158314326
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG0456] Acetyltransferases [COG2267] Lysophospholipase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.98231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACTG ATGCGGATCA CCCCGTCGGG GATCGCGCGG AGCTGACCCT GCGCGCCGCC 
GGGCCGGGTG ACGTCGCCGC GCTTGTCGAG CTGATCGAGT CCGCGTACCG GGGCGAGCGC 
AGCCGGGTTG GCTGGACCAC CGAGGCCGAC CTGCTGGGCG GCCAGCGCAC CGACCCGGAG 
ATGCTCGCCG CCGCGCTCGC CGAGCCCGAC ATCCGGATGC TCCTCGCGCT CGGCCCGGCC 
GGGGAGCCGG TCGGCTGCTG CCAGCTCCAG CGGCGCCCGG ACGGCGCCTA CTTCGGCATG 
TTCGCCGTCC AGCCGGACAT CCAGGGGCAA GGGATCGGGG ACCGTCTGCT CACCGCCGCG 
GAGGCACTCG CCCGCGACGA GTGGGCGGCG GCCCGGATGG AGCTGTACGT CATCTCGCTG 
CGCGCCGAGC TGATCGCCTG GTACGAGCGG CGCGGCTACC GGCGTACGGA CCGCCACGAG 
CCCTTCCCCT ACGGGGACAC CCGGTTCGGC GTGCCGCTGC GCGACGACCT GGTCTTCGCC 
GTCCTGGAGA AGGACCTCGG CCACCGGGTC GACGTCGGCG GCCTCGCGCT GCACGTCGAG 
ACCTGGACGG GCCAGGCGCA CTCATCCACC CCGCTGCTGC TCCTGCACGG CATCGGTGGG 
AGCACCAGGG ACTGGGCCGG GGTGTCCCGC GAGCTCGCCG GCGCCGTGTC GAGCCGGGTC 
GTGGCCTACG ACCACCGCGG CCACGGAACC AGCGGGCGGG CGGCCCGCCC GGAGTACACC 
TTCGACCACC TCGTCCGCGA TCTCGAGACC GTCGTCGCGA CGCTGGAGCT GGCGCCGCTG 
CACCTGCTGG GGCATTCGAT GGGCGGGGTG GTCGCGCTCC GGTACGCGCT GGCCCACCCC 
GAGGCCGTCC GGTCGCTGAT CCTGATGGAC ACCGCCGCGG CGCCGGCGGC GGGTGATCAT 
CTGCTGTCCC GGCTGGGCAT GGGCGCGCTC ATGGAGGGCA TCGCCGCCGC GACCGCGCTG 
CTGGGGCACG GGGACCACGC CGACCCCGCC GCCCTCGCCG CCTTCGGCCA CGAGCTCAAC 
GCCTACCCCT CGATGATCGA CCGGCTGGGC GAGATCCGCT GCCCCACGAC GGTCATCGTC 
GGCGAGCGGG ACGTCCTGCT GCGTGGTGCC GCGCGGGATC TGGCCGGCGC CATCGAGGGT 
GCCCGGCTCG CGGTGATCGC CGGTGCCGAT CACAACCCGC AGGCCAGTCA CCCACAGGCC 
TGGCTCAGCG CGGTGGAGCG GCACGCCGCC TTCTGA

Protein sequence

MATDADHPVG DRAELTLRAA GPGDVAALVE LIESAYRGER SRVGWTTEAD LLGGQRTDPE 
MLAAALAEPD IRMLLALGPA GEPVGCCQLQ RRPDGAYFGM FAVQPDIQGQ GIGDRLLTAA 
EALARDEWAA ARMELYVISL RAELIAWYER RGYRRTDRHE PFPYGDTRFG VPLRDDLVFA 
VLEKDLGHRV DVGGLALHVE TWTGQAHSST PLLLLHGIGG STRDWAGVSR ELAGAVSSRV 
VAYDHRGHGT SGRAARPEYT FDHLVRDLET VVATLELAPL HLLGHSMGGV VALRYALAHP 
EAVRSLILMD TAAAPAAGDH LLSRLGMGAL MEGIAAATAL LGHGDHADPA ALAAFGHELN 
AYPSMIDRLG EIRCPTTVIV GERDVLLRGA ARDLAGAIEG ARLAVIAGAD HNPQASHPQA 
WLSAVERHAA F