Gene Franean1_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2000
Symbol
ID	5670401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2405169
End bp	2406962
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	76%
IMG OID	641240921
Product	serine/threonine protein kinase
Protein accession	YP_001506343
Protein GI	158313835
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0547084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCCC TCCGCGCGGA TGATCCCCGG ACCACCGGCG GATACCGGCT GCTCGGCCTG 
CTCGGCGCCG GCGGGATGGG CCGGGTGTAC CTGGCCCGCG GCCCGGGCGG GCGCACCGTC 
GCCGTCAAGG TGATCCGGCC GGAGTTCGCC GGCGATCCGA CGTTCCGCGC CCGGTTCCGC 
CGCGAGGTCG AGGCCGCCCG CCGGGTTGGC GGCGCCTGGA CCGCGCCGGT GATCGACGCC 
GACCCGGACG CCGAGCAGCC CTACCTGGTC ACCGGTTACG TCCCGGGACC GTCCCTGCTG 
GAGGCGGTGC GCCGGCGCGG CCCGCTTCCG GTACCGACCG TGCGGGCGCT GGGTGCCGGC 
CTCGCCGAGG CGCTGAGCGC CGTGCACGCC GCCGGCCTGG TGCACCGCGA TCTCAAGCCC 
TCGAACGTGC TGCTCGGCCT GGACGGGCCA CGGGTCATCG ACTTCGGGAT CTCCCGCGCG 
TTCGACGCCA CCGTGCTCAC CCATTCCGGG TCCGCGATCG GCTCGCCGGC CTTCATGTCA 
CCCGAGCAGA TCGGCGGGCA GGAGGTGGGG CCGGCCAGCG ACGTCTTCGC CCTCGGCTCG 
GTGCTCGCCT TCGCCGCGAC GGGATCAGGC CCGTTCTCGG GCAGCGGGAT GCCCGCGGTG 
ATGTACGGCA TCCTGGCGGG CGAGCCGCGG CTCGACGCCG TCCCGGCCGA GCTGCGCGGC 
ATCGTGGACG CCTGCCTGCG CAAGGCGCCG GGTGAGCGCC CGGGGCCGCT CGACGTGCTC 
GCGGAGCTCG TCCCGGGCGG CGGCGCCGCC GAACTGATCA CCGCTGGATG GCTGCCGCAG 
GACCTGGTCA CCGGGCTGAG CCGGCAGGCC GTCGCGCTCC TCGACCTGGA CGTCCCCGCC 
ACCACCACCG TGACGAACGA CCACGCCACA CCGGAAGATC ACAACCGGGC ACTGCCATGG 
CCGCCGGAGC CGGCCGCACC GCCAGCCACA GCAGCCACAG CGGCCACAGC GGCCGCACCG 
CTAGCCACAG CGGCCGCACC ATCGGGCGTA TCGCGGGCCG CACCACCGGG CACACCGGCC 
GCACCATCGG GCACCCCGGT CGGGCCCGGC GCCCCGCCGG CCGGTGGGCG GCGCGCCCTC 
GTGACCGTGG CCGCCCTGGG TGTCGTGTGC CTCGCCGTGA TCGTGACGGC CGTCCTGCTG 
GTTGCCCTGC GCGGCTCGGA CGGCGGCTCG GACGGCGGCG GCGCGGACGC CGGCGTGAGC 
CCCGGGGCCA CCGCCGGGAT CGGCTCCCTG ACCGACCTCC TCGACCAACC GACCTCGAGG 
CCGACCGTCG GCGGGCCGCC GGCGAGCTCG GGTTCGGCGC CCTCGGGCGG GTCGGGTCCC 
ACGGTGCCGG GGGCCCTGCC GGCCGGGTAC GCCGGCACCT GGGAGGGAAG CATCACCTCG 
CGGCTGGGGG TCGTGCAGGA CGTCGTGATC ACGCTGCGGC CCGGCGAGAG TGGTCAGACG 
GTCGGCCACT CCGAGGTCAC CCTGGTCGGG CTGGGGGCGT TGGGAGGTGA CGCGTCGATC 
CGGTGCGTCG GTGACCAGCA GCTCGTGGGC ATCAGCACCG CGGCGGGCTC CAGGCCCGAG 
GTGGTCCTGC GCGACATCGG GGGCGCGGGC GACAACCCCA CCCTGCTGGG TCTGCCGGTG 
TGCACGAGCG GCGGCACGAC GAGGCTGCGC CTCGCGGCGG ACGGCGCCCT CGACTACCAG 
TCCGAGGACG AGGCCGGCGG GCGCCCGGCG GGAAGCCTGC GCCACCGCCC CTGA

Protein sequence

MEPLRADDPR TTGGYRLLGL LGAGGMGRVY LARGPGGRTV AVKVIRPEFA GDPTFRARFR 
REVEAARRVG GAWTAPVIDA DPDAEQPYLV TGYVPGPSLL EAVRRRGPLP VPTVRALGAG 
LAEALSAVHA AGLVHRDLKP SNVLLGLDGP RVIDFGISRA FDATVLTHSG SAIGSPAFMS 
PEQIGGQEVG PASDVFALGS VLAFAATGSG PFSGSGMPAV MYGILAGEPR LDAVPAELRG 
IVDACLRKAP GERPGPLDVL AELVPGGGAA ELITAGWLPQ DLVTGLSRQA VALLDLDVPA 
TTTVTNDHAT PEDHNRALPW PPEPAAPPAT AATAATAAAP LATAAAPSGV SRAAPPGTPA 
APSGTPVGPG APPAGGRRAL VTVAALGVVC LAVIVTAVLL VALRGSDGGS DGGGADAGVS 
PGATAGIGSL TDLLDQPTSR PTVGGPPASS GSAPSGGSGP TVPGALPAGY AGTWEGSITS 
RLGVVQDVVI TLRPGESGQT VGHSEVTLVG LGALGGDASI RCVGDQQLVG ISTAAGSRPE 
VVLRDIGGAG DNPTLLGLPV CTSGGTTRLR LAADGALDYQ SEDEAGGRPA GSLRHRP