Gene Franean1_3883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3883
Symbol
ID	5675724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4619152
End bp	4620480
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	72%
IMG OID	641242763
Product	diguanylate phosphodiesterase
Protein accession	YP_001508180
Protein GI	158315672
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.385825
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00073239
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGACGCGT GGGAAACATG CTGGCGAGTG CCGCGTGGGG AGGTGCACGT GACCGACGCC 
TATGGTCGCG GCGGCGCCAC ACCGCCGTCC CGGTGGGATC CGGTCGAACC GGACCCGGTG 
GCCGGGCTAC TCGCCACCGC CCGTCGCCGC CTGGGCATGG ATCTCTGTTG GTTCTCCAGG 
CTGATCGGGG GAGCCCAGGT GATCGAGGCG TGCGACGGCG ACGCCGCGGC CTTCGGTGTC 
CACCCCGGCT CGACGGTGCA CGATCCCGGC CCGCACCGCT CGAATGCTCT AGCCGAACGT 
GCTCTAGCCG AACGCCCGCC TCCGGTCGTC CGCAGGATCC GCCCGGAGGC GGTGACGTCC 
GAGGCAGCGG GGCCGGCGAT GACCGGGGGG CCGCTGGCCG ACCGGCCCGA GATCGGCTCG 
TACATCGGAG TTCCGGTGAC CCTGGCGGAC GGCCGTCCGT ACGGGATGTT GTGCTGCCTG 
AGCCGCGACG CCGACGTGGC GACGCCCGGC CGCAAGGCGC GTTCGCTGGC CCTGCTGGCG 
GAGGTGCTGT CCGCCTCGAT CTCCGACCGG CGGTCCGGCG GGGAGGACCG GGAGGCGGCG 
TGGTGGCGGA TCTGGCGGCT GATCGAAAGC GGCGGCCCGA CGATGGTCTT CCAGCCGGTC 
TTCGACCTGC CGTCGCTCGA CTGCGTGGGG GCTGAGGCGC TTGCCCGGTT CCCGCCCGGT 
TCGGGTGGTG CCGAGCGCTG GTTCGCCGAC GCCGCCGCCG TGGGTCTCGG CCCCGCACTC 
GAACTGTCCG CGATCCGGTC GGCGCTGCGC GCGTTCACCC GCCTGCCGCC TGAATTCGGG 
CTCGGGGTCA ACGCCTCACC GGCCACGATC CTCTCGGGGC GGCTGGCGGA TGCGATCGCC 
GATATCCCGG CCGACCGACT CGTTGTCGAG GTCACCGAGG GTGACAAGGT CGAGGATTAT 
CTGTCGGTCC GCTGCGCGCT GGGCGTCCTG CGCCGTGAAG GAGTCCGGAT CGCCGTGGAC 
GACGTCGGTG CCGGCTACGC CAGCCTGCAT CATCTTGTGC AGCTCCAGCC CGACTTCATC 
AAGATGGATC AGTGTCTCAC CCGGCGGATC GACGCTGATC CGGCGCGGCG CGCGCTCGCC 
GCCGCGCTGG TGCACTTCGC CCAGGAGACA GGCAGCCTGG TCCTCGCCGA GGGGGTCGAG 
ACCGCGCGGG AGCTCGGTGT CCTGATCGGC ACGGGCGTGC ACCAGGCGCA GGGCCACTAC 
CTCGCCCCAC CCGGTCCGCT GCCACTGCCC GCGAGCGCCA ACCGGACCCG CCCGCCCGAT 
ACGGCTTAG

Protein sequence

MDAWETCWRV PRGEVHVTDA YGRGGATPPS RWDPVEPDPV AGLLATARRR LGMDLCWFSR 
LIGGAQVIEA CDGDAAAFGV HPGSTVHDPG PHRSNALAER ALAERPPPVV RRIRPEAVTS 
EAAGPAMTGG PLADRPEIGS YIGVPVTLAD GRPYGMLCCL SRDADVATPG RKARSLALLA 
EVLSASISDR RSGGEDREAA WWRIWRLIES GGPTMVFQPV FDLPSLDCVG AEALARFPPG 
SGGAERWFAD AAAVGLGPAL ELSAIRSALR AFTRLPPEFG LGVNASPATI LSGRLADAIA 
DIPADRLVVE VTEGDKVEDY LSVRCALGVL RREGVRIAVD DVGAGYASLH HLVQLQPDFI 
KMDQCLTRRI DADPARRALA AALVHFAQET GSLVLAEGVE TARELGVLIG TGVHQAQGHY 
LAPPGPLPLP ASANRTRPPD TA