Gene Franean1_6244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6244
Symbol
ID	5674563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7580438
End bp	7581610
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	70%
IMG OID	641245096
Product	epocide hydrolase domain-containing protein
Protein accession	YP_001510492
Protein GI	158317984
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGTCG AGCCTTTTCG GATCCACATC AGCGAGGACC GTCTGGCCGT GCTCGGCGAC 
CGGCTGCGCA CCACCGACTG GGCGGAAGAT CCGGTACGGG ACGACAGCTG GCACTACGGC 
GTGCCCGCTC CGTACCTGCG CGAGCTGACC GAGTACTGGG CCACGCGGTA CGACTGGCGC 
GCGCACGAGG CGGCGATGAA CCGGTGGCCG CACGTCCGGG GCGAGATCGA CGGTGTCACC 
GTCCATGCGC TCCACGAACG CGGCTCCGGC CCCGCACCGC TTCCGCTCGT CCTCTCCCAC 
GGATGGCCGT GGACCTTCTG GGACTTCAGG AAGGTGATCG AGCCGCTCGC TCACCCCGAA 
CGTTTCGGCG CCGATCCCTC GGACGCCTTC GACGTCGTCG TGCCGTCCCT GCCCGGCTCG 
GTCTTCTCCT CGCCCACCCC GGCCGGGGTC GGATTTCGGC AGACCGCCGC CCTGTGGGTG 
AAACTCATGA CCGAACTCGG CTACCAGCGC TTCGGCGCGC ACGGCGGCGA CTCGGGCGCG 
TACGTCACCG CACAGCTCGC CCACGAGTTC GCCGACCGGC TCGTCGGCGC ACATCTGACG 
TTCCCCGCTT TGCTCGGCAC CGACCTGGGC GGGGTGAGCC GGGACGACTT CGCGCCCGAG 
GAGGTCGACG ACTTCGACCG GCAGCGTCCC GCGATGCTCA ACCTCACGCA TTTCCTGACG 
CACACCTTCG AACCCCGGAC CCTGGCCTGG GCGTTGCAGG ACTCCCCCGC CGGCCTGGCG 
GCCTGGATGG TTCAGCGGCG GCGGGCCTGG AGCGACTGCG GCGGCGACGT GGAACGCCGC 
TTCAGCAAGG ACGATCTCAT CACGAGCTTC GCCCTCTACT GGCTCACCGG CACCGTCGGC 
GGCTCGCTGC GGTTCTACGC CGACTCGTTC CAGCGGCCGT GGATCCCCTC GCACGACCGT 
CGGCCCGTCC TGGAGTCACC GACGGGCATC GCCGTGTTCC CGTACGAGCT GACGCATGTG 
CCACGCACTC TTGCGCAGCG CGAGGCGAAC CTCGTGCACT GGACCCGGAT GAGCCGTGGC 
GGCCACTTCG CAGCGGCTGA GGAACCACAA CTCGTCGTGG CGGACATCCG CGCGTTCTTC 
CGGCCGCTGC GCGCGACCGG ACTGTCCCGC TGA

Protein sequence

MAVEPFRIHI SEDRLAVLGD RLRTTDWAED PVRDDSWHYG VPAPYLRELT EYWATRYDWR 
AHEAAMNRWP HVRGEIDGVT VHALHERGSG PAPLPLVLSH GWPWTFWDFR KVIEPLAHPE 
RFGADPSDAF DVVVPSLPGS VFSSPTPAGV GFRQTAALWV KLMTELGYQR FGAHGGDSGA 
YVTAQLAHEF ADRLVGAHLT FPALLGTDLG GVSRDDFAPE EVDDFDRQRP AMLNLTHFLT 
HTFEPRTLAW ALQDSPAGLA AWMVQRRRAW SDCGGDVERR FSKDDLITSF ALYWLTGTVG 
GSLRFYADSF QRPWIPSHDR RPVLESPTGI AVFPYELTHV PRTLAQREAN LVHWTRMSRG 
GHFAAAEEPQ LVVADIRAFF RPLRATGLSR