Gene Franean1_2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2140
Symbol
ID	5670540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2568165
End bp	2570354
Gene Length	2190 bp
Protein Length	729 aa
Translation table	11
GC content	73%
IMG OID	641241061
Product	diguanylate cyclase/phosphodiesterase
Protein accession	YP_001506482
Protein GI	158313974
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGGG CCGTCCGGCG TCTCACCACG CCGGTGGCCC GACGGTGCCA GGAATCACCC 
GGTTCGACCG CATACAGCGG TTCGGCAGTG CGTGGCGGCG CGGCTGCGCG CAGCAGTGCC 
GTGGCGACGG CCGGCGGGGG GAAGACGGCG AGGGCGCAGG CCACGGTCGC GCACGCCGGA 
GGGGAAACGT CGGATGCGCC GATGACCTCT CCTGCGATGG CGCACTCGCC GACCACCGGA 
GGTTCTCCGA CGTTTCCGGA GCTGGAGGTC TCCAGCGCGG GGCGCTCGAG CGGCGGAGAC 
CAGCACGGCC GGAATCGGCC CTGGGGCGGG CGGCAGCGCG CGGGCGGCCG TGTCGACGAG 
ACCACGACAT CCGGTCGGCG GCCCGGCGTC CTCGCGTCTG CGTCCGTGGT TCTTCTCGTA 
GGGGTCGTGT CCTGGTGGGC GGCGATCAAG GTGCTGGCCC CGTCCGGCGC GATCACCACA 
TCGCTGACGG TGGCGGCGGT GGCGTGCCTG CCGCTGTCCG GACTGGGTGA CCGGATGGTC 
GCGGCGGTCC GTCGCCGCTG GTACGGCTCG GACGATCTGA CTGGCCTGCC AGGTCGTCGC 
CATTTCGTCG CGACCGCCTC CCGCTGGCTC GGGGGCGGTC ACCGAGCCCG GGGCTCGGTG 
TCGGCGGCGC TCATCCTGAT CGATCTCGAC CGCCTCCGGG ACATCAACGG GACGCTCGGC 
CACGAGCACG GTGACCACAT GCTGGCCACC GTCGGCGCCC GGCTGCGTTC CGTGCTGCGT 
CCCGCCGACC TGCTCGCGCG GGTCGACGGC GACGAGTTCG CGGTACTGCT GCGGGACGTC 
GACCTCGCCG GCGCCGAGGC GGTCGCCCGG CGGATCCGGG AGGCGCTGAG AATCCCTGTC 
CGCCTGGATG ACCTGCGCGT CCAGGCCGAC GTCAGTGTCG GTATCGCCCA TGCTCCCGAA 
CACGGGCGCG GCATCCTGGA GCTCATGCGG CGGGCGGAGG AGGCGATGTA CGCGGCCAAG 
GGGACCCACA CCGGCCAGCG TGTCTACGAC CCTGCCTGCC AGCTCGGCAA CCGTGCCCAG 
CTGGGGCTGC GGGCCGACCT GCGGGAGGCG CTGGACGGCG GCCAGATCGA ACTCCGCTAC 
CAGCCCAAGG CCGAAATGCG CAGCGGCCGG ATCAGGGGTG TCGAGGCGCT GGTGCGATGG 
CGCCATCCCA CCGGCGGGCT CCGTCCGCCG AACATGTTCC TGCCCGAGAT GGAACGCGCC 
GGCCTGATGG GGCGCCTGAC CCAGCAGGTC CTCGACATCG CCCTCGCCGA CTGCGCCCGC 
TGGCACGCGG CCGGCGCCGC GCTGGCCGTG TCGGTGAACG TGCCCGCCTC GGTCATCGTC 
GACCGCGGAT TCGTGGACCT GGTGCGCGGT GCGCTGGAGC GCCACGGCCT GCCCGCGTCG 
GCGCTGGTCG TCGAAGTCAC CGAGGACGGG CTCATCACGG TCCTGGAGCA GGCACAGCGG 
ACCCTCTCCG GCCTGCGTGA CCACGGTGTG CGGGTCAGCC TCGACGACTA CGGCACAGGC 
CTGTGCTCGC TCGCCTACCT GCGGGAGCTC CCCGCGGACG AGGTGAAGCT CGACCAGCGG 
TTCCTGCGCG ACATCGACCG CGACTCCTCG GCGGCCGAGA TCGTCCGGTC CACGGTTTCC 
CTCGCGCACG CGCTCCGGCT GCGCATCGTC GCCGAGGGCG TCGAGACGTC GCGCTCGTGG 
GCGTCGCTTG CGGCCTGGCA GTGCGACGAG GTCCAGGGCT ACTTCGTCTC CCGCCCGCTG 
GCGGGGGAGC GGGTGCTGAG CTGGCTGCGC GAATGGGGCG ACCGGCTCCG GTGGCTGCCC 
TCCGGGGGGG AGCCTGCGCC GACGGGTCCG ATCAGGGTCA CCACCGCCTC GCGTGGCGCC 
CGAGTGCACT CGGTGGCTAC CGCCGCGAAC GCCCAGCTCT CCTCGCCCGC AGCAGGAGCG 
GCGTCCGCCG CGCCGGTCGC GACGGCGTCG ATGATGACTT CGGGTTCGGC GTGCGGCGCC 
GCGGAGCCGC CCACGGCGGG CAAACCCTCG CTCGCCGTGC CGTCCAGTCG CCCGGGCCTG 
CGGTCGATGG GATTCCGCAT GTCGCAGCAT GCTGAGGCGG GAAGCCGGCG GCCGTCCGGT 
CAGCCTGCCC ATGATGGGTG GGGAGCCTGA

Protein sequence

MSRAVRRLTT PVARRCQESP GSTAYSGSAV RGGAAARSSA VATAGGGKTA RAQATVAHAG 
GETSDAPMTS PAMAHSPTTG GSPTFPELEV SSAGRSSGGD QHGRNRPWGG RQRAGGRVDE 
TTTSGRRPGV LASASVVLLV GVVSWWAAIK VLAPSGAITT SLTVAAVACL PLSGLGDRMV 
AAVRRRWYGS DDLTGLPGRR HFVATASRWL GGGHRARGSV SAALILIDLD RLRDINGTLG 
HEHGDHMLAT VGARLRSVLR PADLLARVDG DEFAVLLRDV DLAGAEAVAR RIREALRIPV 
RLDDLRVQAD VSVGIAHAPE HGRGILELMR RAEEAMYAAK GTHTGQRVYD PACQLGNRAQ 
LGLRADLREA LDGGQIELRY QPKAEMRSGR IRGVEALVRW RHPTGGLRPP NMFLPEMERA 
GLMGRLTQQV LDIALADCAR WHAAGAALAV SVNVPASVIV DRGFVDLVRG ALERHGLPAS 
ALVVEVTEDG LITVLEQAQR TLSGLRDHGV RVSLDDYGTG LCSLAYLREL PADEVKLDQR 
FLRDIDRDSS AAEIVRSTVS LAHALRLRIV AEGVETSRSW ASLAAWQCDE VQGYFVSRPL 
AGERVLSWLR EWGDRLRWLP SGGEPAPTGP IRVTTASRGA RVHSVATAAN AQLSSPAAGA 
ASAAPVATAS MMTSGSACGA AEPPTAGKPS LAVPSSRPGL RSMGFRMSQH AEAGSRRPSG 
QPAHDGWGA