Gene Franean1_0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0059
Symbol
ID	5668485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	74912
End bp	76456
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	68%
IMG OID	641238988
Product	serine/threonine protein kinase
Protein accession	YP_001504433
Protein GI	158311925
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGGCG TGACCGAGGT CGCCGAGATC CTCGGAGTCA GCCGACAGCG CGTCGCGAAG 
CTGCGGGATC GCGCCGACTT CCCCGACCCC ATCGCCGAGA TCGCGCAAGG ACCGATCTGG 
GATCTTGACA AGATCGAGGA ATGGGGCGGG TCGGACCTGC GGCTCTCGCC CGGCCGGCCA 
CGAGCCGACA CCGTGGCGCG GACCCTCGGC GGCCGGTTCG TTCTGGAGGA GCCGCGCATC 
GGACACGGCG GCTTCGGTGA CGTCTATCGC GCGATGGACC GCAAGCAGCC TGGCCGCAAC 
GCCGCGCCCG TCGCTGTGAA GCTGATGCGC GATGCCAGCA TGGTCGACCC GGAAGCAGTG 
CGCCGCTTCG AGCGGGAGCT GCGGCTGCTC GAGCCGATCA GGCACCCGAA CATCGTCCCG 
ATTCTCGGCC ACGGCAAGAC CCCGGCAGGC GCAATTTGGT ACGCCATGCC TCTTGCGCAG 
GGCAGCCTGG TCGACTTCGC CGAGGAGCTC CACGGCAGGA ACGCCCTGAT CCTCGACCTA 
ATGCGGCAGG TCGGCGCGGG CCTGACGCAC ATCCATGATC GAAAGATCTA TCACCGGGAC 
CTCAAGCCCG GCAACATCCT GCGCCTAGCG GACGGCGTTT GGGCGATCGC GGACTTCGGG 
CTGGCTGTCG ATGCGGAACG CGCTACCACC GCGCTCACGT CCACGCTCCG CGGGATCGGA 
ACGGCATGGT ACACGGCGCC GGAGCAGTGG CGCGACGCCC GCAATGTCAA CCACCTGGCA 
GACGTGTTCG GCCTCGGCAA GGTCCTGCAG GAGCTCGTCA TCGGCGATGC ACCGGTCACC 
AACGAGGTCC CACCCGGACC GCTACGCCCG ATCGTGCAGA GAGCGATCGC GGAGCGGCCC 
GAGCACCGCT ACGCCTCCGT CCGGGACTTC CTCGCCGCGC TAGCGACCGC GATCGAGACG 
CCGAGGGACG GCTGGGAAAG CGCCGAGGGC ACCGCCGAGC GGTTGCTTGA ACGGGTCAGG 
CTACCCAAGG CGGCTGAGGT AGACCTCGAC GAGCTGGCGA CCTGGGCGCT CGCTCTCGAC 
GAGAGCGACA CGGACGACAT GACGGCCCTT GCCCGGGTTC TCCCCTGGAT CTCGACCAGG 
TCGATTCACT ATCTCTGGGC CGCAGACCCC GCAGGTTTCC AGAGGATCTT CAGGCACTAT 
TCGAAGCACG TCGAGACCAC CGGTTTCGGC TTCGAGTACT GCGACGTGCT CGCCGACTTC 
TCCCGCAGGG CCGTCAAGGA AACCGACGAC TCAGACGTCC TTCGCGAGGC CATCCGATCC 
CTGGTCGAGC TCGGCCACCG TCATAGCCGT TGGCGGGTGC GCGGCGTCGT CACGACGATC 
TTGCAGGGCA TCCGCAAGCC GGAGCCCGCC CTCGCCGCCG TCGAGGCACT ACGCGCTGCC 
GACGTGGAAG CCGTCGAATG GACGCTCAGC GAATTCTCGA TCCGCTCTCT ACCGCCCATC 
CTCCGCAACG AGATCAACAT GCTGCTCAGC GCCGCCAGCC GCTGA

Protein sequence

MGGVTEVAEI LGVSRQRVAK LRDRADFPDP IAEIAQGPIW DLDKIEEWGG SDLRLSPGRP 
RADTVARTLG GRFVLEEPRI GHGGFGDVYR AMDRKQPGRN AAPVAVKLMR DASMVDPEAV 
RRFERELRLL EPIRHPNIVP ILGHGKTPAG AIWYAMPLAQ GSLVDFAEEL HGRNALILDL 
MRQVGAGLTH IHDRKIYHRD LKPGNILRLA DGVWAIADFG LAVDAERATT ALTSTLRGIG 
TAWYTAPEQW RDARNVNHLA DVFGLGKVLQ ELVIGDAPVT NEVPPGPLRP IVQRAIAERP 
EHRYASVRDF LAALATAIET PRDGWESAEG TAERLLERVR LPKAAEVDLD ELATWALALD 
ESDTDDMTAL ARVLPWISTR SIHYLWAADP AGFQRIFRHY SKHVETTGFG FEYCDVLADF 
SRRAVKETDD SDVLREAIRS LVELGHRHSR WRVRGVVTTI LQGIRKPEPA LAAVEALRAA 
DVEAVEWTLS EFSIRSLPPI LRNEINMLLS AASR