Gene Franean1_4088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4088
Symbol
ID	5672446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4868861
End bp	4871413
Gene Length	2553 bp
Protein Length	850 aa
Translation table	11
GC content	76%
IMG OID	641242964
Product	serine/threonine protein kinase
Protein accession	YP_001508381
Protein GI	158315873
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.527089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTCA TCGACCGGGC TCGGGTGGCC GCGGCGCTGC CGGGGTACGT GCTCGGCCGC 
GAGCTGGGCG CGGGCGCGTT CGGTCTGGTG ATCGCCGGGC GTCGACTCGC ACCCGGCCCC 
GGCGCGCCTG GCCTGGACCA GGCGGGAGGC GACGCGGCGG GCGACGGCGC CGCAACGGAC 
GTGGCCGTCA AGATCCTCGA CCTGGGCGTG GCCGACGGTG ACGGCCCCAG CGGGGCGTCC 
GCGGGCACCG TCGTGCTCGG GTCGGATCCC GGGGCCGGTC CGCCGCCGGC CCCGGACCGT 
GACCAGGACG CCCGGATCCT CACCCAGCTT GAGCATCCGC ACCTGTGCCG GCTGCTCGAC 
ATCGTCCCCG TCGACGGGCT GCGCCTGCTG GTGAGCGAGC TGCTGCCCGG CGGGACGCTG 
GCCAGCCAGA GCCTGACCCC GCCGGCCGCG TGCGCGGTCG TGCTCGCCGC CGCCGATGCG 
CTGATGCACG CCCACGCCGC CGGCGTCCTG CACCGCGACG TCAAACCCGC CAACATCCTT 
TTCGCCGCGG ACGGCCGTCC GAAGCTGACG GACCTGGGCG TGGTCGGGCT CGTCGATGGG 
ACGTCGCTCA TCGCCGGCGG CGTCGTCGGA ACCGCCCAGT ACATGGCACC CGAGCAGGTG 
ACCGGGGGCC GCCTGGGGCC CGCGACCGAC GTCTACGCGC TGGCCGCGAC CCTGTACGAG 
CTGCTGGCCG GGACGCCGCT GTTCGGTGCC GGCCTGACCA CGCCAGACCT GTTACGCCAT 
CACTGCGAGG TCGTCCCGGC CCCGCCGCCG GGCGTTCCGC CACCGGTGGC GGCGGTGCTG 
GCCAGAGCGC TGGCGAAGGC GCCGGGGGAG CGGCACCGCA CCGCCGGGCA GTTCGCCATG 
GATCTCGCCG CGGCCGCGCG GCTGGGGTAC GGCGGCGACT GGCTGGCGCG GGCGGACGTC 
CCGCTGGCGG TCAGTGACGG GCTGCGCGAG CAGGGGTCGG GGCCCCACCC GGCGCTGGGA 
CCGCCGGGCG CCACCGGCGC ACCTGGCTCC GGCCCCGGAG GGGCCGGAGC CAGCTGGGCC 
GAGGACGATC CGGCGGGGCG GACCACGAGA CTGGACCCGC CGCTGCCGCC GGTGACCTCC 
CTGCTTCCGG AGCCCGTGCC TGTCGGCCCG CCTGGCGCGT TCCCGCCGGC GGCGCCAGGC 
GAGCCGGCCG GTGGCGGCCC CGGGGCCACC AGCGCCACCG ATGCTGGCAC GGCCACCGAG 
GGACCGCCGA CCCGCTCGGG CCATGACGAC ACCGGTGGCC CCGGTGGCCC CGGTGGCCCC 
GGCGGGCCTG ATGGACCGGC CGGCCGGAGG GCGTCCCGGC GGCGGGTTTG GATTGTTGGC 
GCTGCGGTCG CGGCGGTGCT GGCGGTCGTG GCCGCGTTGG TCGTCCCGCG GGTCACCGGC 
GACGAGCAGG CGGTCACCGG TGCCGCTCCG GCCAGCCCGC TGAGCGGTCC GGGTACGGCG 
GCGCCGCCGG AGCGGCCGGG ACCGCTGCCG CCGCCACCGC CGTACCCGGT GGTCACGGTG 
GCCGGGACGG GCGAGGCGGC GTTCTCCGGC GACGGCGGCC CCGCCGGCTC GGCGGCGCTC 
AACGGCCCGT TCGGGATGGT CGCGGACTGG GCCGGCAACA TCTACGTCGC CGACTTCGAC 
AACAACCGGG TCCGGCGGAT CACGGCGGAC GGGACGATCA CCACGATCGC CGGGACGGGC 
GAGGCGGGCT TCTCCGGCGA CGGCGGCCCC GCAACCCAGG CACGGCTGCG CCAGCCGGCG 
GCCGTCGCGC TCGACTCGGC CGGCAACATC CTGATCGCCG ACACGTTCAA CCAGCGCATC 
CGCCGTGTCG ACCCGTCCGG GACCATCACG ACGGTGGCGG GCAAGGATGA CCGTGGGTTC 
AGCGAGGACG GTGTGCCGGC GACCGAGGCC ACCCTCTGGT ACCCCGGTGG GGTGGTGGCC 
GACCCTACCG GCAACATCTA CATCGCCGAC AGCGGCAACA ACCGGATCCG GCGGGTCGGC 
ACCGACGGGA TCATCCAGAC CGTGGCCGGC GGGGACGGCG AGGGCGCGTT CGGTGACGGC 
GGCCCGGCGG CCGATGCCCT GCTGGCGTTC CCGATCAGCG TGGCGATGGA CCGCCCCGGC 
CGGCTCTACA TCGCCGACTC CGGCAACAAC CGGATCCGCC GGATCGGGCT GGACGGGGTG 
ATCGAGACCG TCGCCGGCAC CGGCCTGCCC GGCTACTCCG GCGACGGCGG GCCGGCTACC 
CGCGCCACGC TGCGTTCCCC GCGCGGGGTG GCCGTCGACG CGCGGGGCGC CATCTTCATC 
ACAGACCGGA CCAACCGGCG TATCCGGCGG GTCGACCCGT CCGGGATCAT CACCACCGTC 
GCGGGCACCG CCCACCCGGG CCGGGACGAG TCCGTCGACC CGGACGAGAT GAGTCCCGAT 
GGGCCGGTCG CGCTCGATCC CACCGGGGAC GTCTTCGTCG CCGACCGGCG ACACAACCGG 
GTGCTCCACG TGGAGCTGAC CGGCTCCGGG TAG

Protein sequence

MSVIDRARVA AALPGYVLGR ELGAGAFGLV IAGRRLAPGP GAPGLDQAGG DAAGDGAATD 
VAVKILDLGV ADGDGPSGAS AGTVVLGSDP GAGPPPAPDR DQDARILTQL EHPHLCRLLD 
IVPVDGLRLL VSELLPGGTL ASQSLTPPAA CAVVLAAADA LMHAHAAGVL HRDVKPANIL 
FAADGRPKLT DLGVVGLVDG TSLIAGGVVG TAQYMAPEQV TGGRLGPATD VYALAATLYE 
LLAGTPLFGA GLTTPDLLRH HCEVVPAPPP GVPPPVAAVL ARALAKAPGE RHRTAGQFAM 
DLAAAARLGY GGDWLARADV PLAVSDGLRE QGSGPHPALG PPGATGAPGS GPGGAGASWA 
EDDPAGRTTR LDPPLPPVTS LLPEPVPVGP PGAFPPAAPG EPAGGGPGAT SATDAGTATE 
GPPTRSGHDD TGGPGGPGGP GGPDGPAGRR ASRRRVWIVG AAVAAVLAVV AALVVPRVTG 
DEQAVTGAAP ASPLSGPGTA APPERPGPLP PPPPYPVVTV AGTGEAAFSG DGGPAGSAAL 
NGPFGMVADW AGNIYVADFD NNRVRRITAD GTITTIAGTG EAGFSGDGGP ATQARLRQPA 
AVALDSAGNI LIADTFNQRI RRVDPSGTIT TVAGKDDRGF SEDGVPATEA TLWYPGGVVA 
DPTGNIYIAD SGNNRIRRVG TDGIIQTVAG GDGEGAFGDG GPAADALLAF PISVAMDRPG 
RLYIADSGNN RIRRIGLDGV IETVAGTGLP GYSGDGGPAT RATLRSPRGV AVDARGAIFI 
TDRTNRRIRR VDPSGIITTV AGTAHPGRDE SVDPDEMSPD GPVALDPTGD VFVADRRHNR 
VLHVELTGSG