Gene Franean1_1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1097
Symbol
ID	5669511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1309865
End bp	1311235
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	72%
IMG OID	641240029
Product	diguanylate phosphodiesterase
Protein accession	YP_001505459
Protein GI	158312951
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCCTC AACAGTCGAC CATCAGGCAC CCGGTCGAGG CCGGTCTACC GGGGTCGCGC 
GGACCCGCCG GTCAGGGTCA GGTGGACGAG GCGGGCGGAG CCCGCCCCGC GGACGGACGC 
CGCCAGGTTC CCGGCCTGCC CACGCAGCCG GATCTCGACG GCATCCTGGC CGACCCCGAC 
ACGCCGTCCC TTGTCTTCCA GCCAATCGTG GACCTGCGCC GCGGCGTCAC GGCCGGCTAC 
GAGGCCCTGG CACGCTTCGG CCCGGACCCG CGCAACGCAC CCCATCTCGT GTTCGGCGAG 
GCGGACCGCC GCGGCTGCGC GGCCGAGCTC GAGGCCCGGG TCCTGCGCCG GGCACTCGCC 
GCCCGCGATC ATCTTCCCGA CCGTTGTTTT CTCGCCGTCA ACGTGTTACC GCATCTTCTT 
TCCTCCCCCG AGGTCGCGGC GGTCTGGCGG AGCGCCGATC TCTCCCGCAT CGTTCTCGAG 
CTGAACGAGG CCGTCGACAT CGAGCGCGCG ACCGGTCTGA CGGCGACCTC GCAGGAGCTG 
CGGGACCACG GCGCGTTCCT CGCCATGGAC GATGTCGGTT CGGGATATGC CGGCCTGCGC 
CAGCTCACCC ACATCCGGCC CGATTTCGTG AAACTCGACG CGTCACTGGT CTCGAACATC 
GACGACGACC AGGTGAAGAT CGCACTCACC GAGCTGGTCG GCGGATTCGC CAGCCGCCTC 
AACGGCTGGG TCATCGCCGA GGGTGTGGAG CGCGTCCAGG AGCTGACCAT GCTGGTCGCC 
CTCGGCGTCC CCCTCGGGCA GGGCTTCCTG CTCGGACGGC CGTCCGCCCG CTGGCAGGAG 
CTTGACCCGG CCGTGGCCAG GCGGATCAGG CTGCTCTCCG CGCGCTCCGA CCGTTCCTCG 
CGCATCGTGA GCCTGATGGA GCCGGTCCGG ATCTCGACCG GCGACTACGG GCGCTGCGGC 
CAGGTCCCGG GCTGCCCGCC CTGCGTGCAC TCGCCCGCGC CGGGCGACGA CGCCGGCTCG 
CCGTCCCCGG GCGGACGTCC CGAGGAACAC GCCGAAGAAC ACGCCGAGGA TCACGAAACG 
CTCAGGGGCG ACGGTTCCGG TGGCGGGACT GCCATCATCG TCAGCAACCG GTGCCGGCCG 
GTCGCCGTGC GGCTGGCCGG CGGCGCGGGT GGGCGGGAGC CGCAGCGGAT TCCCACGTCG 
CTGTTCGCGC TCCCGGACGA GCCCGTCACG GAGGTCGCCC GCCGGGCGAT GACCCGGCCC 
GCCGGCTGCC GGTTCGACCC GGTGATAATC GTGACCGAGA TGGGACGGCC TCTCGGCCTG 
GTACGGATGG AGCGCCTGAT GCTGCGTCTC GCGGATCTGT CGGCCACATG A

Protein sequence

MVPQQSTIRH PVEAGLPGSR GPAGQGQVDE AGGARPADGR RQVPGLPTQP DLDGILADPD 
TPSLVFQPIV DLRRGVTAGY EALARFGPDP RNAPHLVFGE ADRRGCAAEL EARVLRRALA 
ARDHLPDRCF LAVNVLPHLL SSPEVAAVWR SADLSRIVLE LNEAVDIERA TGLTATSQEL 
RDHGAFLAMD DVGSGYAGLR QLTHIRPDFV KLDASLVSNI DDDQVKIALT ELVGGFASRL 
NGWVIAEGVE RVQELTMLVA LGVPLGQGFL LGRPSARWQE LDPAVARRIR LLSARSDRSS 
RIVSLMEPVR ISTGDYGRCG QVPGCPPCVH SPAPGDDAGS PSPGGRPEEH AEEHAEDHET 
LRGDGSGGGT AIIVSNRCRP VAVRLAGGAG GREPQRIPTS LFALPDEPVT EVARRAMTRP 
AGCRFDPVII VTEMGRPLGL VRMERLMLRL ADLSAT