Gene Franean1_0575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0575
Symbol
ID	5668992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	666727
End bp	668487
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	71%
IMG OID	641239502
Product	diguanylate cyclase
Protein accession	YP_001504940
Protein GI	158312432
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAC TCCGCAACGT CGTCGTTTCT GCACATAGTC CGTGGCGTCT GACCGGTTCG 
GGCCGTACGC CACGAGTGTT GCGGTGCGCC ATCGCCGCCT CCCTGGCGCT GCTGGGGCTG 
GATGTCGCCT TCGCGGTGCT GCTGGACCTG CGCTCCGCCC GCGTCGCCAC GGACCTCGTC 
TCCACCGCAG CCCAGTTCGC CGCCGCGGCC GCCTGTTTCT GGACCGCCCG GCGGGTACGC 
GGGGCGGAGC GCCGCTGGCG GGTGCTCATC GGTCTCACCG CCGCCGGAGC GATGCTCGCC 
AGCCTCTCGA TCGCACCGAC GTTGCTGGCC GGAGACCTGC CCCACAGGCA AGGCATGTCC 
CCGGCGTATG CCGTCTTCCT CTCCCTCTAC GGGGTGGCCC TGGCCGGGCT GCTGTCCCTG 
CCCACCGACC CGGTGGACAG CCGGGGCGGG AGTGCTGGCA GGCGATGGTA CGGCGCCCAC 
CGCTGGTATG CGATCACCCT GCTGGACTGC CTGCTGATCG CCGGCTCGCT CGTCCTGCTG 
CAATGGGGGA CGGTGCTCTC CGCGGTCGTC CAGACGGGCC CCGACATCAG ACCATTCCGG 
CTCGCCCTGA CCCACCAGGG TGCCGGCCTG ATCCTCGCCA CCGCGGTCGT GCTGATCGCC 
AGCTTCCGCC GACCCCGCGC CCCCGCAACG CTGGCACTAC TGGGCACCGG CCTGCTGGCC 
TACGGACTCA CCACCAACAT CATCTCCTAC GTCGCCGCGG AGTACGGGTT CCACCTGCCG 
CCCTGGGGCC TGATCGGGTT CGCTCTCGCC TACCTGCTGG TCTTCCTCGC CGCGTTCGTC 
CCGGTCCCGA CCCGCACGCC CCCCGAGGGC CCCGCCCCGC CCAGCCCGCG GGCGATGTGG 
GCACACGCCG CGCTGCCCTA CGCCGCGCTC ACCGCCGCGG GCCTGCTGAT CCTGGGCAAG 
CTGGCCACCG GTGCCCGCCT CGACCGGTTC GAGACCTACG GCATGATCAC ACTGCTGGTG 
CTCGCCCTGC TCCGGCAGAT GGTCACCCTC GCAGAGAACA CCCGGCTACT CGCCGAGATC 
CGGGAACGCG AACGGCAACT GCACCACCAG GCGTTCCACG ACCCGCTGAC CGGCCTGGCC 
AACCGGACAC TGTTCACCCG CCGGCTGCAA CGAGCCCTCA CCCAAGGCAC CGACAGCGAC 
ACCACCCACA CCCCCGCCAT CACCTCCGGC GAGGACACGG TGTCCGTCCT GTTCCTCGAC 
CTTGACGGCT TCAAAAAGGT GAACGACACG TTCGGCCACG CCGTCGGCGA CGAACTCCTC 
CAGATCAGCG CCGACCGGCT ACGCGCGGAA ACCCGCGCGA TCGACACCGT CGCCCGCCTC 
GGCGGCGACG AGTTCGGCGT CATCCTCGAC GGCGGCGGCC CCGACGACCC CCGCCGCATC 
GGCGAACGGC TCGCCACCGC CGTCCAGGCC CCCTGCCTGC TGGCGGGGCG GCCTTACACC 
CCCCGCGCCA GCCTCGGCCT GGTCACCCTC GACAGCACCA CCACCCGACC CGCCACCCCC 
GACATCCTGA TCCACCAGGC CGACCTGGCC ATGTACACCG CCAAACGCAC ACAAACCGGC 
GGACTCGTCA TCTACCAACC CGACCCGTCC ACCCCCACGA CCACCACCAA CCATCATCCC 
GACCACCCGA CACGATCGGT TGAAAGTTCG GTTTGTGGGT TTCGGGACCG CCCGGCGCAC 
GATCCGGGTC CCGTTCCGTG A

Protein sequence

MPELRNVVVS AHSPWRLTGS GRTPRVLRCA IAASLALLGL DVAFAVLLDL RSARVATDLV 
STAAQFAAAA ACFWTARRVR GAERRWRVLI GLTAAGAMLA SLSIAPTLLA GDLPHRQGMS 
PAYAVFLSLY GVALAGLLSL PTDPVDSRGG SAGRRWYGAH RWYAITLLDC LLIAGSLVLL 
QWGTVLSAVV QTGPDIRPFR LALTHQGAGL ILATAVVLIA SFRRPRAPAT LALLGTGLLA 
YGLTTNIISY VAAEYGFHLP PWGLIGFALA YLLVFLAAFV PVPTRTPPEG PAPPSPRAMW 
AHAALPYAAL TAAGLLILGK LATGARLDRF ETYGMITLLV LALLRQMVTL AENTRLLAEI 
RERERQLHHQ AFHDPLTGLA NRTLFTRRLQ RALTQGTDSD TTHTPAITSG EDTVSVLFLD 
LDGFKKVNDT FGHAVGDELL QISADRLRAE TRAIDTVARL GGDEFGVILD GGGPDDPRRI 
GERLATAVQA PCLLAGRPYT PRASLGLVTL DSTTTRPATP DILIHQADLA MYTAKRTQTG 
GLVIYQPDPS TPTTTTNHHP DHPTRSVESS VCGFRDRPAH DPGPVP