Gene Franean1_1190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1190
Symbol
ID	5669603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1415793
End bp	1417226
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	73%
IMG OID	641240122
Product	peptidase M16 domain-containing protein
Protein accession	YP_001505550
Protein GI	158313042
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0547363
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.134748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGAGA CGGATCTGTC CACCTCGGAC GACCGCACCT CGGACGGTCG CACCTCGAAC 
GACCGCACCC CGGGCCTGGC CGGGCCGGAG CACGCCTCCG GCCCGCGCCC GGCCCGGGTG 
GCCGAGCTTC TCGCGGCGGG TCCCGGTTCC GAGGTCCTGC TCGCCGGGGC CGTGCGCCGC 
ACGGTGCTGC CGGGCGGCCT GCGGGTCGTC ACGGAGAAGG TCCCCGGGGT CCGGTCGGTG 
GCGATCGGGA TCTGGGTGGG CGTCGGCTCG CGGGACGAGA CGCCGCTCAC CGGTGGCTGC 
TCGCACTACC TGGAGCACCT GCTGTTCAAG GGCACCCCGA GCCGGGACGC CCTGTCGATC 
AGCGCCTCCA TCGAGGCCGT CGGCGGTGAT CTCAACGCCT TCACCGCCAA GGAGTACACC 
TGCTACTACG CGCGGGTGCT CGACGTGGAC ATGGACCTGG CCATCGACGT CGTCTGTGAC 
ATGGTCGCCA ACTCGCTGGT GACCGCGGAC GACGTCGAGG CCGAGCGGGG CGTGATCCTC 
GAGGAGATCG CCATGCACGA GGACGACCCC GGCGACGTCG TGCACGACGT CTTCGCCGAC 
GCCGTCCTCG GCTCCTCCGT CCTGGGGCGA CCGGTGCTCG GCACGGTCGA CACCATCGAG 
GCGCTCGGCC GGGAGACGGT CTTCGACTAC TACCGCGAGC GGTACGCCCC GCCCGCGCTG 
GTCGTCTCGA TCGCCGGCAA CATCGAGCAC GACCACGCCC TGGACCGGGT GGTGGCCGCG 
TTCGCCGACC GGCTCACCGG GCCCGCCCGG CACCAGGAGG TGCGCCGCGG CGAGTACCCG 
TTCCCGCCGC CGCCGGGCAT CGTCGTCACC AACCGGCCGA CCGAGCAGGC CCACGTGGTG 
CTCGGCACGG CCGGCCTGTC CCGGCACGAC CCGCGCCGGT ACGCGCTCGG CGTGCTGTCG 
ACGGCCCTCG GTGGCGGGAT GAGCTCGCGG CTGTTCCAGG AGGTGCGGGA GAAGCGCGGG 
CTGGCCTACT CCGTGTACTC CTTCGACAAC CAGTTCGCCG ACGCCGGGCT GTTCGGCGTC 
TACGCGGGCT GTACCCCGGG GCGCGCCGAC GAGGTGCTGG AGATCTGCCG CGAGCAGGTG 
CACCGGATCG CCGAGCACGG CATCACCGCG GAGGAGCTCG AGCGGGCCCG CGGCCAGAAC 
CGCGGCGGCC TGGTGCTCAA CCTGGAGGAC ACCGGGTCGC GGATGAGCCG GCTCGGCAAG 
AGCGAGCTCG TCCACGGCGA GCTGCTCTCG GTCGACGAGG TGCTCGCCCG GGTCGAGGCC 
GTCACACTCG ACGACGTGCG GGCCGTCGCC GGCGAGCTGG TCGACCAGCC GTGGGCGCTC 
GGCGTCATCG GCCCGTTCGA GGACCACGAC TTCAGCGCGG CCGTAGCGCG GTGA

Protein sequence

MTETDLSTSD DRTSDGRTSN DRTPGLAGPE HASGPRPARV AELLAAGPGS EVLLAGAVRR 
TVLPGGLRVV TEKVPGVRSV AIGIWVGVGS RDETPLTGGC SHYLEHLLFK GTPSRDALSI 
SASIEAVGGD LNAFTAKEYT CYYARVLDVD MDLAIDVVCD MVANSLVTAD DVEAERGVIL 
EEIAMHEDDP GDVVHDVFAD AVLGSSVLGR PVLGTVDTIE ALGRETVFDY YRERYAPPAL 
VVSIAGNIEH DHALDRVVAA FADRLTGPAR HQEVRRGEYP FPPPPGIVVT NRPTEQAHVV 
LGTAGLSRHD PRRYALGVLS TALGGGMSSR LFQEVREKRG LAYSVYSFDN QFADAGLFGV 
YAGCTPGRAD EVLEICREQV HRIAEHGITA EELERARGQN RGGLVLNLED TGSRMSRLGK 
SELVHGELLS VDEVLARVEA VTLDDVRAVA GELVDQPWAL GVIGPFEDHD FSAAVAR