Gene Franean1_5221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5221
Symbol
ID	5673555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6268037
End bp	6270187
Gene Length	2151 bp
Protein Length	716 aa
Translation table	11
GC content	78%
IMG OID	641244075
Product	serine/threonine protein kinase
Protein accession	YP_001509485
Protein GI	158316977
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0344538
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAGCAC GGAAGAGTAC GACGACCCCG TCAACCGGCC CGGTCGGCGC GTTCGGGCGC 
GATCTTCGCG CGGCGCGGTG CGGGGCGGGA AATCCCTCGT ACCGGACCCT GGCGCGACGC 
AGCGGAATGC CGGCGGAGAT CCTGGCCGGC GCCGCCAGCG GCGGGTCGCT GCCGGCGCTG 
GACGTCCTGT GTGCCTTCGT GTCCGCCTGC GGTGGGGACG TCGGCTCCTG GGTGGCGCGG 
TGGCACGAGC TCGCGGCGAT CCTGGAGGCG GAGCGCGAGA CCCGGATAGC CCCGCCCGGG 
GCGGACGTCC CGTCGCAGCC GCCGCCGGTC GGGCCGTGGC CGCCGCGCAC CAGCGGCGCG 
CCGCCCGGAT CACGCCCACC CCACGCGTCC CCCGGCAGGG TTCCCTCCCA GCGTTCCAGC 
GGCGGGCCGG CCGACGACTT CCTCGCCCCG CTCAGCGCCG ACGACCCTCG GGAGGTCGGG 
CCGTTCCGGC TGCGCGGCCG GCTGGGCTCC GGCGGCATGG GCGCGGTGTA TCTGGGCCAC 
TCCCCGGGGC AGCGGCCGGT CGCGGTGAAG GTCATCCGCG CCGACATGGC GTCCGACAGC 
GAGTTCCGGC GTCGTTTCGA GCGGGAGGTC GCCGCGATGG GCCGGGTGAA CAGCCTGTTC 
ACCGCGCCGC TGATCGCCGC GGACGTCGCC GCGGACCGCC CGTGGCTCGC CACCGCCTAC 
ATCCACGGCC CGACGCTGCG CGACAGCGTG CTGCGCAACG GCCCGCTGCC GCCGTCCAGC 
CTGCTCCGGC TGGCCGCCGG GGTGACGGAG GCGCTCGTCG CCATCCACGG CGCGGGGGTC 
GTGCACCGTG ACCTGAAGCC GGCGAACGTG CTGCTGGCGA TCGACGGGCC CCGCGTGATC 
GACTTCGGGA TCGCGCGGGC AGCCGACCAC GCGGGCAGCA CCACCACCGG GAAGGTCATC 
GGATCGCCGC CGTACATGTC GCCCGAGCAG GCCCGCGGCG AACGGGTGGA CGCGGCCTCC 
GACGTGTTCG CCCTCGGGTC GGTGCTCGCC TTCGCCGCGA CCGGGCGCAA CGCCTTCGGC 
GAGGGCAACA CCGCCGATGT GATCTATCGC GTGGTCCGGG GGGAGCCGGA GCTGACCGGC 
GTGGACGGCG ACCTGCGCGC GCTGATCGAG TCGTGCCTGG CCAAGGCGCC GCAGCGGCGG 
CCGACGCCGG CCGAGATCCT GGGCCGCTGT CACGCCCAGC TCGGGGCCAG CCCCCGCCCG 
CCCAGCTGGC TGCCCGTGCC GGTGATCGCC GAGATCAGCC AGCGGCTGCG GCATCCGGCC 
GTGGTGGACC GTCCCACGGA GCCGGCCCGC CGCCCGGTGC GGGGGCTGGT GGTCGCGGCG 
TCCGTGCTGG CCACCGCCAC GGTCGTCGCG ATGACGCCGG CGCGCAGCGT CCTCACCCCG 
TGGGAGCTGC TCCCGAGCTG GGGCGACGGC GCGCAGGCCC CGCGGGCGCC GTCGAGCCCG 
CCGCCCACGC CGACCGCCGG GGGCGTGGCG GAACGGCGGT CGGCCGAGCG GCAGTCGGCG 
GGCAGCCGGC GCACCACCGA CGGCCGCGGC GCCGGGACAT CCGCCGGCAC GCCGGGTGGC 
ACGTCGGACG GCCTGGCGGA CGGCGCGGCG GGCGGCACGT CCGCGGGGAT GCCCGGCGAA 
GCGACCGGAG GCACCATCGG CGGCGTCGCG GGCGGACTGG AGCAGGGCCT GCCGGGCACG 
GGCCAGGATC CGGGAACGGG CCGGGGACCG GCCGGCGGCC CGGTTCAGGC GCCGGCCGCC 
CCGCAGTCCG GCGGGAGCGG CGGCCAACCG GCCACACCCG GGACACAACG CCCACCGGCC 
GTGCCGCAGG CGCCGGGTCC GGGTCCGGGT CCGTCCTGGC CGTTCCCGTC GCAGGGCTCG 
GGCGCGACGA ACCCCCCACC AGCGCAGCCG CACCCGACGC CGGGATCACC CATGGCCACC 
GACCCGCCCC CGCCAGCAAC GCCGGAGGAC CTGCCCAGGA CCACCGCACC CCCGCCGGAG 
ACGCCCCCGC GGACCACTCC GCCACCGGAA CCGGCACCGC CCGAGACCCC GGCGGCGCAC 
CCCGGCTCAC CGCCGGCGGA GACCGCCCGC ACGGAGGCTC AGGACCTCTG A

Protein sequence

MRARKSTTTP STGPVGAFGR DLRAARCGAG NPSYRTLARR SGMPAEILAG AASGGSLPAL 
DVLCAFVSAC GGDVGSWVAR WHELAAILEA ERETRIAPPG ADVPSQPPPV GPWPPRTSGA 
PPGSRPPHAS PGRVPSQRSS GGPADDFLAP LSADDPREVG PFRLRGRLGS GGMGAVYLGH 
SPGQRPVAVK VIRADMASDS EFRRRFEREV AAMGRVNSLF TAPLIAADVA ADRPWLATAY 
IHGPTLRDSV LRNGPLPPSS LLRLAAGVTE ALVAIHGAGV VHRDLKPANV LLAIDGPRVI 
DFGIARAADH AGSTTTGKVI GSPPYMSPEQ ARGERVDAAS DVFALGSVLA FAATGRNAFG 
EGNTADVIYR VVRGEPELTG VDGDLRALIE SCLAKAPQRR PTPAEILGRC HAQLGASPRP 
PSWLPVPVIA EISQRLRHPA VVDRPTEPAR RPVRGLVVAA SVLATATVVA MTPARSVLTP 
WELLPSWGDG AQAPRAPSSP PPTPTAGGVA ERRSAERQSA GSRRTTDGRG AGTSAGTPGG 
TSDGLADGAA GGTSAGMPGE ATGGTIGGVA GGLEQGLPGT GQDPGTGRGP AGGPVQAPAA 
PQSGGSGGQP ATPGTQRPPA VPQAPGPGPG PSWPFPSQGS GATNPPPAQP HPTPGSPMAT 
DPPPPATPED LPRTTAPPPE TPPRTTPPPE PAPPETPAAH PGSPPAETAR TEAQDL