Gene Francci3_2421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2421
Symbol
ID	3906404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2811667
End bp	2812965
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	71%
IMG OID	637879751
Product	diguanylate phosphodiesterase
Protein accession	YP_481517
Protein GI	86741117
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0356024
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0553373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACA TGGAGGTGGT CCGGATGACG GATGCGCTGT CGACGTTGGG CCCGCCGGCA 
GGCGTCACAC AGCCGGACAC AGTAGTGACG GATCTCCTCG AGATCCTGCG CCGGCATCTG 
CGGATGGACG TCGCGGGGCT GGCCCGGATC GACGGGGATC TGCTTGTCCT GCAGGTTCTC 
AGCGGGGACG CACGGGGGTT CAGGTTGGCG CCGGGTTCGA CGATCCGCCG CGAGCATGCC 
CTGCTCGGGC GGGTGCTGTC CGGCGAGATA CCGGAGATCG TCGCGGACAC GCGCACCGAT 
CCGCGCACCG CGGACGCGGG CGTCGTCCGC GAGTTGGGCG TCGGCGCGTA CGCCGCGGCG 
CCGGTCGCCG ACAACGACGG CGAGGTGTAC GGCATAGTCG GCTGCCTCGC CCACGACGCG 
CTCCCCCACC CACGCGACCG CGACGTGCAC TTCCTGCACC TGTTGGCGGC CTTCCTGAGC 
GACGCGGTCC TCGACCTGCA CCGCCTGTGG GAACAGCGAC GCCGCATCTG GCAGGAGGTG 
AGCGACCTCA TCGACGCGGG CGGCCCAAAG ATGATCTTCC AGCCGATCTT CAGGCTCACG 
GACGAGCGGA TCGTCGGGGT CGAGGCGCTG TCCCGCTTCC CCCACACGAC CGGCGATGCG 
CAGCAGTGGT ACAACGACGC CGCAACCGTC GGCCTGAGCA TCGAACTGGA ACTCATGGCG 
ATCCGCCACG CGCTGACCGT CCTGCCGACG CTCCCGTCCG ACCTCACCCT CGCCGTCAAC 
GCCTCGCCGT CCACCATCAC CTCCGGCCTG GTCGACATCC TTCCCGACCG GGGGGCCGAT 
CGCCTCATCG TGGAGATCAC CGAGCACGAG CACATCGGCG ACGACTCGGA GCTGCTGGTC 
GCCGTCGGCG TGCTGCGCCG CCGCGGGGTC CGCATCGCGA TCGACGACGT CGGCACCGGC 
TACGCGGGCC TGGAACAGCT CATCCACCTG CGCCCGGAGA TCATCAAACT GGATCGGGTC 
CTCACCCACG GGATCGACAC CGATCCGGCC AGGCGCGCCA TCGCGACGGG ACTGGTGCAG 
GTCGCCGGCG AGATCGGCGG CTGCGTCATC GCCGAGGGCA TCGAAACCCC GATGGAGCTC 
GACACGGCGA TGGCGGCCGG GATCCCCTAC GGCCAAGGCT ACCTGCTCGG CCATCCCACC 
ACGACCGCCG GGGCCGCCTG GGTGGAGCAC TCCGCGCACC GGCCGACGGC CGCCGAACCG 
GAACCGGTGC CGGCCACCTC CTCCCGGCGG CTCGGCTGA

Protein sequence

MPNMEVVRMT DALSTLGPPA GVTQPDTVVT DLLEILRRHL RMDVAGLARI DGDLLVLQVL 
SGDARGFRLA PGSTIRREHA LLGRVLSGEI PEIVADTRTD PRTADAGVVR ELGVGAYAAA 
PVADNDGEVY GIVGCLAHDA LPHPRDRDVH FLHLLAAFLS DAVLDLHRLW EQRRRIWQEV 
SDLIDAGGPK MIFQPIFRLT DERIVGVEAL SRFPHTTGDA QQWYNDAATV GLSIELELMA 
IRHALTVLPT LPSDLTLAVN ASPSTITSGL VDILPDRGAD RLIVEITEHE HIGDDSELLV 
AVGVLRRRGV RIAIDDVGTG YAGLEQLIHL RPEIIKLDRV LTHGIDTDPA RRAIATGLVQ 
VAGEIGGCVI AEGIETPMEL DTAMAAGIPY GQGYLLGHPT TTAGAAWVEH SAHRPTAAEP 
EPVPATSSRR LG