Gene Franean1_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2024
Symbol
ID	5670425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2431996
End bp	2432985
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	76%
IMG OID	641240945
Product	alpha/beta hydrolase fold
Protein accession	YP_001506367
Protein GI	158313859
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.44574
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA GCACGGGCAC AGGTGACAGC ACGGGCACAG GTGACAGCGC GGGCGCGAGC 
GGCGAGGCTG GCATGGTCTC GAAGTGGGTC GACCTGGACG GCCCCGTGCA CTACGCGGAG 
TTCGGCGCGC CCGGAACCAT CGGCGGGAGC CCGCCGGTGG TGTGCGTCCA CGGCCTCGGC 
GGGTCGTACA CCAACTGGCT CGCGCTGGCC CCCCTGCTCG CCTCGACGTC CCGCGTGCTC 
GCGCCCGACC TCGCCGGCCA CGGCCGCACC CCGCTCGGCA ACCGCGGTGC CGACGTGTCG 
GCGAACCACC TCCTGCTGGA CCGCTTCCTG GCCGAGGTCG TGGGGGAGCC GGTGATCCTC 
GTCGGGAACT CGATGGGCGG TCTGATCAGC ATGCTGCAGG CGGTCCGTCG CCCGGAGTCG 
GTGTGCGGGC TGGTCCTGCT GGATCCCGCG CTGCCGCTGC GCCGCGGCGG CTGGCCGGAG 
CCGCTGGTCG TCGCGTCGTT CGCCGCCGTG GTCCTCCCGG GACTCGGGGC GTGGGTGCTC 
GCCCGGCGCC GCGCCCGGGT CGGCCCCGCC GGCATCGTGG CCCAGACCCT GCGCCTCTGC 
ACGACGGATC CCGCCCGGAT CCCGTCCGTC GCGGTCGAGG CACTGGTCGA CCTCGGCCAG 
GAGCGGGCGG GCATGGACGG GGTCGAGCGC GCCTATGTCG CCGCCGCCCG GTCCGTGGTG 
CGCCGGGTCG TCCGCGGCGG CCCGCTGCGG CGGCTGATCC GCCAGGTGGA CGTCCCGACG 
CTGCTCGTGC ACGGGTCGGA CGACCGGCTC ATCCCGGTGG CGCTGGCCCG GGACGCCGCC 
GGCCTGCGTC CCGACTGGCA GCTGGCGGTC GTCGCCGGCT GCGGGCACCT GCCCCAGCTC 
GAGGACGCGG CCGGGACGGC CGGGCTCCTG ACGGGATGGT GGGAGCAGAC GCGGGACGCC 
AGCGGCGGCG CGCGGAAAGC AGTGGCGTGA

Protein sequence

MSDSTGTGDS TGTGDSAGAS GEAGMVSKWV DLDGPVHYAE FGAPGTIGGS PPVVCVHGLG 
GSYTNWLALA PLLASTSRVL APDLAGHGRT PLGNRGADVS ANHLLLDRFL AEVVGEPVIL 
VGNSMGGLIS MLQAVRRPES VCGLVLLDPA LPLRRGGWPE PLVVASFAAV VLPGLGAWVL 
ARRRARVGPA GIVAQTLRLC TTDPARIPSV AVEALVDLGQ ERAGMDGVER AYVAAARSVV 
RRVVRGGPLR RLIRQVDVPT LLVHGSDDRL IPVALARDAA GLRPDWQLAV VAGCGHLPQL 
EDAAGTAGLL TGWWEQTRDA SGGARKAVA