Gene Franean1_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0189
Symbol
ID	5668614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	231593
End bp	233140
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	73%
IMG OID	641239118
Product	metallophosphoesterase
Protein accession	YP_001504562
Protein GI	158312054
COG category	[R] General function prediction only
COG ID	[COG1409] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.326449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCACA GCCTTCGCGG TCCACGACGT TCCCGGTCAC GATCCTCCGA GTCGCCGGCC 
TCCGCACCAC GCGACGCCGC ACCACGCGAC GCCCCGCCGC GGCCCGGCGG AGGGCCGTCG 
CACGCCGAGC ACGGGGTGCA CCTCGCCTTC GGCGCGGATC CGGCGACGTC GATGGTGGTC 
TCCTGGATCA CCCGGGAGCC CGTCGTCCGG CCGCTGGCCC GGGTGGTCAC GGGCACCGCC 
GAGGCAGTCC GCGAGGTCGA GGCCGGCACC AGGTCGTACA CGGACGCGGC CACCGGGTGG 
GAGATCTACG CGCACCACGC GCTGCTGGAC GAGCTGGCGC CGGACACCGA GTACACCTAC 
GAGATCACGT ACCAGACCAC GGCGGCCGGG GTCGTCCGCG AGGTGGGCCG GGCGTCGTTC 
CGGACGGCCC CCCGCGGCCG GGCCGCCTTC ACCTTCGCCT GCTTCGGCGA TCACGGCACC 
GACGCGTCCG ACAACCCGTT CGGCACGCCG GCCTCCGGCG CGCTCGTCGC CGGCGTCGAG 
CGGGTGGACC CGCTGTTCAC CCTGGTCGAC GGCGATCTGG CCTATTCGAA CGTCAGCGAC 
GTCCCGCCGC GGGCCTGGGC GGACTGGTTC GCGATGATCA GCACCTCGGC CGCGCGCCGC 
CCGTGGATGC CGAGTGTCGG CAATCACGAG ACCGAGCGGG GAAACGGAGC GCTGGGCCTC 
GCCGCCTACC AGACCTACTT CCAGCCGCCG GACAACGGTG AGGAGCCTTA CCTGGCCGGC 
CTCTGGTACG CCTTCACAGT GGGTGGCGTA CGGTTCGTCG TGCTCAGCGG CGACGACGTC 
TGCTACCAGG ACGCCGGCCG CGTCTACCTG CACGGCTACA GCTCGGGTCG GCAGACCGCC 
TGGCTCGAGC GGCAGTTGGC CGAGGCCCGG GCGGACCAGG CGGTCGACTG GATCATCGTG 
GCCCTGCACC AGGCAGCAGT CTCCACAGCG GAGTTCCACA ACGGCGCGGA CCTCGGCCTG 
CGCGAGGCCT GGCTGCCGTT GTTCGACCAG TACGGCGTCG ACCTGGTGAT CTCCGGGCAC 
GAACACCACT ACGAGCGCAC ACACCCGCTA CGGGGGGTTG TGGACGGCAG CACGACGCTG 
ACCCCGCGGC CGGTCCCGGG CTCGGTGTCC GTCGCGGGGG GCGGCGGGGG CGGTACTGCC 
ACGCTCGACA CGTCCGCCGG GACGGTGCAC ATGCTGATCG GCACCGGCGG CTCGTCCACG 
CCGTCGGCCG GGCAGCTGTT CGACCCGCCG GCCTGCCGGG TGGTCGTCGG GGTGCGGGAG 
CGGGAGCCCG GGCAGCGGCA GCGCTCCTCG ATCCGTGCGG TCGAGCCGGC TCCGTGGCTG 
GCGGCCCGCT TCCCCGAGCA TCCGTACGCG TTCGCCGCGC TCACGGTCGA TCCGGGCGAG 
CCGGGCGGGA CGACCCGCAT CCAGGTCACC GTCTACGACT CGGCGGACGC CGTGCCCGTG 
CCCTTCGACA CCTTCACCCT CGCCCGCCCG CGCGCCGACG CGACCTGA

Protein sequence

MPHSLRGPRR SRSRSSESPA SAPRDAAPRD APPRPGGGPS HAEHGVHLAF GADPATSMVV 
SWITREPVVR PLARVVTGTA EAVREVEAGT RSYTDAATGW EIYAHHALLD ELAPDTEYTY 
EITYQTTAAG VVREVGRASF RTAPRGRAAF TFACFGDHGT DASDNPFGTP ASGALVAGVE 
RVDPLFTLVD GDLAYSNVSD VPPRAWADWF AMISTSAARR PWMPSVGNHE TERGNGALGL 
AAYQTYFQPP DNGEEPYLAG LWYAFTVGGV RFVVLSGDDV CYQDAGRVYL HGYSSGRQTA 
WLERQLAEAR ADQAVDWIIV ALHQAAVSTA EFHNGADLGL REAWLPLFDQ YGVDLVISGH 
EHHYERTHPL RGVVDGSTTL TPRPVPGSVS VAGGGGGGTA TLDTSAGTVH MLIGTGGSST 
PSAGQLFDPP ACRVVVGVRE REPGQRQRSS IRAVEPAPWL AARFPEHPYA FAALTVDPGE 
PGGTTRIQVT VYDSADAVPV PFDTFTLARP RADAT