Gene Franean1_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1200
Symbol
ID	5669613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1433222
End bp	1434907
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	71%
IMG OID	641240132
Product	beta-lactamase domain-containing protein
Protein accession	YP_001505560
Protein GI	158313052
COG category	[R] General function prediction only
COG ID	[COG0595] Predicted hydrolase of the metallo-beta-lactamase superfamily
TIGRFAM ID	[TIGR00649] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.582889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.255924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCATC CGCACCCGGA GCTGGGCCCC CCACCGCCGC TGCGTGCCGA CGGCCTGAGG 
ATCATCCCGC TCGGCGGCCT CGGTGAGATC GGTCGCAACA TGACCGTGTT CGAGCATGCC 
GGGCGGCTGC TCATCGTCGA CTGCGGGGTG CTCTTCCCCG AGACCGACCA GCCCGGCGTC 
GACCTCATCC TGCCGGACTT CACCGCAATC CGGGACCGCC TGCAGGACAT CGAGGCGGTC 
ATCCTCACAC ACGCGCACGA GGACCACATC GGCGCCGTCC CGTACCTGCT GCGCGAACGG 
CGTGACATCC CCCTGGTCGG CACCCGGCTG ACGCTCGCGC TCATGGTGGC CAAGCTCGCC 
GAACACCGCA TCCAGCCGGT GACCCTGCAG ATCCGCGAGG AGGAGAGGCA CTCGTTCGGT 
CCCTTCGACC TCGAGTTCCT CGCCGTCAAC CACTCCATCC CAGACGCGGT CGCGGTCGCG 
ATCCGCACCG ACGCGGGCCT GGTGCTGCAC ACCGGCGACT TCAAGATGGA CCAGCTCCCG 
CTGGACGGGC GGCTCACCGA CCTGGGCGGC TTCGCCCGGC TCGGCCGCGA GGGCGTCGAC 
CTGCTGCTCT CGGACTCGAC CAACGCCGAG GTCCCCGGCT TCGTCGCCTC GGAGCGCGCG 
ATCGCCCCCG TGCTCGACAA GGTCTTCCGC GAGGCGGACA GGCGCATCGT CGTCGCGTGT 
TTCGCCAGCC ACGTCCACCG CGTGCAGCAG GTGCTCGACG CCGCCGAGTC GCACGGCCGG 
TCGGTCTGCT TCATCGGCCG GTCGATGGTC CGCAACATGG GTGTCGCCCG CGATCTCGGC 
CTGCTGCGCG TGCCGCCCGG CCTGGTGATC GACAGCCGGG ACGTCGACTC GCTTCCCGAC 
CGCAACATCT GCCTGGTATC GACCGGGTCG CAGGGCGAGC CGCTGTCCGC GCTGTCGCGC 
ATGGCTAACC GGGACCACGC GATCCGGATC CAGGAGGGCG ACACGGTCGT CCTGGCCTCC 
AGCCTGATCC CGGGCAACGA GACGGCCGTG TTCCGCGTGA TCAACGGTCT GACCAGGTGG 
GGCGCCCGGG TCGTGCACAA GGGCGTGGCG ATGGTCCACA CCTCCGGGCA CGCCCCGGCC 
GGTGAGCTGC TCTACGTCCT CAACGCGACC AAGCCGTCGA ACATGATGCC CGTCCACGGC 
GAGTGGCGGC ACCTGCGTGC GCACGGCGCG CTCGCGGAGG CCACCGGTGT CCCGCCGGAC 
CGGGTCATCA TCGCCGAGGA CGGCATGGTC GTCGACCTCA TCGACGGCCA GGCGGAGATC 
ACCGGAGCGG TGCCCTGCGG GATGGTCTTC GTCGACGGGC TCGCCGTCGG CGACGTGGGG 
GAGTCGAGCC TGAAGGACCG GCGGATCCTC GGCGAGGAGG GCTTCATCAC GATCACGGTC 
GTGGTGGACG CCGCCGCCGG CAAGGTCGTC GTCGGCCCGG ATCTCTCCGC CCGCGGGTTC 
TCCGACTCCC GGGCCGCGTT CGAGGAGGTC CGCGGCAAGC TCGCGGACGC CCTCGCCGAC 
GCGATGCGCT CCGGCATGAC CGACACCAAC GCGCTGCAGC AGCTCGTCCG GCGCACGGTG 
GGCCGTTGGG TCAACGACCG CTACCGCCGC CGCCCGATGA TCCTCCCGGT CGTCCTGGAG 
GTCTGA

Protein sequence

MMHPHPELGP PPPLRADGLR IIPLGGLGEI GRNMTVFEHA GRLLIVDCGV LFPETDQPGV 
DLILPDFTAI RDRLQDIEAV ILTHAHEDHI GAVPYLLRER RDIPLVGTRL TLALMVAKLA 
EHRIQPVTLQ IREEERHSFG PFDLEFLAVN HSIPDAVAVA IRTDAGLVLH TGDFKMDQLP 
LDGRLTDLGG FARLGREGVD LLLSDSTNAE VPGFVASERA IAPVLDKVFR EADRRIVVAC 
FASHVHRVQQ VLDAAESHGR SVCFIGRSMV RNMGVARDLG LLRVPPGLVI DSRDVDSLPD 
RNICLVSTGS QGEPLSALSR MANRDHAIRI QEGDTVVLAS SLIPGNETAV FRVINGLTRW 
GARVVHKGVA MVHTSGHAPA GELLYVLNAT KPSNMMPVHG EWRHLRAHGA LAEATGVPPD 
RVIIAEDGMV VDLIDGQAEI TGAVPCGMVF VDGLAVGDVG ESSLKDRRIL GEEGFITITV 
VVDAAAGKVV VGPDLSARGF SDSRAAFEEV RGKLADALAD AMRSGMTDTN ALQQLVRRTV 
GRWVNDRYRR RPMILPVVLE V