Gene Franean1_0099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0099
Symbol
ID	5668524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	117226
End bp	118992
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	73%
IMG OID	641239027
Product	diguanylate cyclase
Protein accession	YP_001504472
Protein GI	158311964
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCACA GCCGTCGGCG CGACCGGCTC TTCCGCCGCG CGGCGGTCGG CGCCGCGGTG 
CTGACGGGCG CCTGCGTGGT TCTCGCCCAG GTGCTCCCCG ACAGCCTGGC GCTGTCCGCC 
GTCCGACTGA CGGTGATCGG GTTCCTGCTG CTCGGCGGGA CGACCTGCGT GGTCGCCGGG 
CTGCGTCGCC ATGGCGCCGA GCGGTGGTGG CGGCTTCTCA TGGCGGTAAT GGTTCTCGCC 
GTGGCGGTGG CGTCGGCCGC GGTGTTCCGG GACACGGCGG CGGGGCGATC TCCCGTCCCC 
CAGCTGACCC CGGCCTCGCT GGTGTATCTG ATTCCGCTCG CGATGGGTGT CGCCGGCGTG 
CTGCTCTACC CGACCGACCC CGTCGAGCAC GACGACGCCG AGGACGGCGG GCCGCTGCAC 
GCCTACCGCT GGTACGCGAT CACGGTCCTG GACGGCATGA TCGTGGTCGG CTCGGTGGCG 
CTGCTGGTCT GGGCCACCGT GCTGGAGCGC ACGGTCGGGC ACGGCGAACC ACTCGGCCCC 
GGCCCGCTCT ACTCGATCAT CCTCGCCGCG GTCTCGCTCG TGGTCTTCGT CGTGCTGATC 
CTGGTGGCCG TGTTCCGCGA GCCGCGCGAC AGCCGCGGCC ACGCGCTCCT GCTCGCGGGC 
ATGTGCGCCG CCTCGATCTC CGCCATGTGG GAGCTCGCGG TGCTCATCCA CGGCCTGGAC 
GACGTCCCGC GGCTGACCGA CCTGCCCATT GGCATCGGTG CGCTGCTCAT CGGCCTGGCC 
GCCATCTCCA CCGATCCCGA TACGGGTGCC ACTACCGGTG CCGACGCCGC TGCCGACGTC 
GATGTCGATG CCGATGCCGA TGCCGTGGGA GTGGGACTGG CCGCCGTTCC CAGCCTGGGT 
CGGCGGGCCG CCTCGGCCAG GCTCCGCCGG TGGCACGCGA TCCTGCCGTA CCTCCCGCTG 
ACCGCGGCCG GGGCGGCGAC GGTGCTCCAG ATCGCCGGAG ACGGCATCGG GCACTGGGAG 
GAGATCTGGG CGCTGCTCGC CCTGCTGCTA CTCGCGCTGG TGCGCCAGAT GATGACGATG 
TCGGACAACA TCCGCCTGCT CGGCCAGGTG GAGGAGAAAC AGCGGCAGCT GCGGCACCAG 
GCGTTCCACG ACCCGCTGAC CGGGCTGGCG AACCGCAGCC TGTTCATCGA CCGGCTCGAG 
CGGGCGCTGC ACCGCCAGCC GGGCCCCGCC GAGCGCTTCG CCGTCCTGTT CTGCGACCTC 
GACGACTTCA AGCGGGTCAA CGACGTCCTC GGCCACGCGG CGGGCGACGA CCTGCTGCGG 
ATCACCGGCG CACGGCTCGC CGGCTGCGTC CGCGCGGCGG ACACCGTGGC CCGCCTCGGC 
GGTGACGAGT TCGCGATCCT GCTCGTCTCG GCCAACATCG ACGATCCCGA GGCAGTCGGA 
TGTCGGCTGG CGGCCGCGGT CCGGGCGCCG GTGCGGCTGG CGAGCCACAC CTTCACCGTC 
GCGGCCAGCG TGGGCCTGGT GACCGTCGAC CCGGAGACCG GGACGGGTGC CCCGCACCAA 
GGCGCGGACC CGGACCCGGA CCCGGACACG GACACGGAGC CGCGCGCGGA CGTTCCGGAC 
ACCGCCGAGC AGCTGCTGCA CCGCGCCGAC CTGGCGATGT ACGCGGCCAA GGCCAGGCGC 
AACGGGGAGC CGGCCGTCTA CACCCCTGAG CTGGTGGGCC CAGGGCGGGC GCGGGCACGG 
CCCGCCCGGA ACGTCCCGCT GCCCTGA

Protein sequence

MGHSRRRDRL FRRAAVGAAV LTGACVVLAQ VLPDSLALSA VRLTVIGFLL LGGTTCVVAG 
LRRHGAERWW RLLMAVMVLA VAVASAAVFR DTAAGRSPVP QLTPASLVYL IPLAMGVAGV 
LLYPTDPVEH DDAEDGGPLH AYRWYAITVL DGMIVVGSVA LLVWATVLER TVGHGEPLGP 
GPLYSIILAA VSLVVFVVLI LVAVFREPRD SRGHALLLAG MCAASISAMW ELAVLIHGLD 
DVPRLTDLPI GIGALLIGLA AISTDPDTGA TTGADAAADV DVDADADAVG VGLAAVPSLG 
RRAASARLRR WHAILPYLPL TAAGAATVLQ IAGDGIGHWE EIWALLALLL LALVRQMMTM 
SDNIRLLGQV EEKQRQLRHQ AFHDPLTGLA NRSLFIDRLE RALHRQPGPA ERFAVLFCDL 
DDFKRVNDVL GHAAGDDLLR ITGARLAGCV RAADTVARLG GDEFAILLVS ANIDDPEAVG 
CRLAAAVRAP VRLASHTFTV AASVGLVTVD PETGTGAPHQ GADPDPDPDT DTEPRADVPD 
TAEQLLHRAD LAMYAAKARR NGEPAVYTPE LVGPGRARAR PARNVPLP