Gene Franean1_2686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2686
Symbol
ID	5671077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3178548
End bp	3180218
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	69%
IMG OID	641241598
Product	diguanylate cyclase
Protein accession	YP_001507018
Protein GI	158314510
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGGGC TCCGCGTAGT CGGGGGCGTT GTGCCAGGCC TTCTGCGTTC GGCTGACTGG 
TCCCACGTGC CACGGTTGTT CCGGTACGCC TTGGCGGGCT GCCTGCTGTA CGTCGGGCTG 
GCGGCTGTGT TCGCGGCGCT GCTGGCCCCG GGGCCGGCCG GGATCGCCAC GACACTCGTC 
GCGTTCGCCT CCGAGGTCAC CGCCGCAGTG GCCTGCTTCT GGAGCGCTCG GCACGCCGCA 
ACGGATGATC GACGATGGCG GGTGCTCATC GGCATGTTCG TGGTTGGCCT CGCGGGAGGC 
GCCCTCATAA CTGCGGTGAC GTTGCTGAAG GGCGACCCGA TCACGTCCGC TGTGACCTCG 
GAGTATCTGG GCCTGATTGT CTTCTACGGA CTGGCGCTGG CAGGGCTGTT ATGCCTGCCG 
ACCTACCCGG TTGAGGGCCG GGGCGTGCGT GGGCGGGGAG GTGACCTGAG CCGTTGGCAT 
GCGATCGTCG CGCTCGACAG CGTACTGATC GTCGGCTCGG TCCTTCTCCT GGAATGGGGG 
ACGTCGCTGG AGGCGATCGC ACGGGCAAGC GGGCCCGACC CTGCGCAGCT CCTCGGCGCG 
CTCGTCCACC AGCTGTCGGT GCTGATCCTC GCGGCGACTG TGCTGCTGAT CGCGACGTTC 
CGCCGACCGC GGTCCCCGGC GACGTTGGCG CTGCTGGGCA GTGGCCTGCT GGCGTACGCC 
CTCATGAACA TCATCGTCGT CTACCGCTTC GCCCACGGCC ACTACGACCT TCCGGCGTGG 
AGCCTGATGC CGCTCGTCGT CTCCCTCCAG TTGATAGCCC TCGCCGCGCT GGCACCGGTT 
CGTGGCCCGG TGGATCGGGA CAGTGCGGCC GCGCCCGGTC CGCGGGCGAT GTGGGCGCAT 
GCCGCCTTGC CGTATGCCGT GCTCGGCGTG ACCAGCCTGT TGCCTCTTGG CAAGCTGGTG 
GCGGGCACGC CGCTCGACCG GATCGAGGCG TATGGCGCGG TGTCGCTCCT GGCCTTGGCG 
TTCACAAGGC AGATGATCAC CATTGCCGAG AACACCCATC TGCTCACCGC GGTGAGGGAA 
CGCGAGAAAC AGCTGCACTA TCAGGCGTTT CATGACCCCT TGACCGGTCT GGCGAACCGG 
GCGCTGTTCG CCCGACGCCT GCAGCGCGAA GTCGACCATG GCATCGAGCC GAGGAACGAC 
GGCGCACCCA CTGGCGGACA GGCCGCTGTC TCCGTTCTGT TCCTAGACCT GGACCAGTTC 
AAACGGGTCA ACGACACGTT CGGGCACGCC ACCGGCGACG AGCTTCTCAA GATCATCGCA 
GAGAGGCTGC GGGCCGGAAC CCGCGCCAAC GACACGGTCG CCCGCCTCGG TGGCGACGAG 
TTCGCGGTCA TCCTCGACGG CGCCGGCCCG GACAAACCAG TCCAGATGGC CGAGCGCCTC 
GCGGCCGCGG TACAGACGCC TTGCCAGCTC GCGGGCCAGA CCTACCTCCC ACGCGCCAGT 
CTCGGCCTTG TCACCCTCGA CCCCGACGCG CGACCAGCAA GCCCCGACAG CCTGCTCCAC 
CAGGCCGACC TGGCGATGTA CGCAGCGAAA CGCGCCCAGA CGAGCAGACT TGTCGTCTAC 
GACCGCCACC TGACGGTCCG CCGCGGCCGC GATCAACCGT ACCGTCACTA G

Protein sequence

MAGLRVVGGV VPGLLRSADW SHVPRLFRYA LAGCLLYVGL AAVFAALLAP GPAGIATTLV 
AFASEVTAAV ACFWSARHAA TDDRRWRVLI GMFVVGLAGG ALITAVTLLK GDPITSAVTS 
EYLGLIVFYG LALAGLLCLP TYPVEGRGVR GRGGDLSRWH AIVALDSVLI VGSVLLLEWG 
TSLEAIARAS GPDPAQLLGA LVHQLSVLIL AATVLLIATF RRPRSPATLA LLGSGLLAYA 
LMNIIVVYRF AHGHYDLPAW SLMPLVVSLQ LIALAALAPV RGPVDRDSAA APGPRAMWAH 
AALPYAVLGV TSLLPLGKLV AGTPLDRIEA YGAVSLLALA FTRQMITIAE NTHLLTAVRE 
REKQLHYQAF HDPLTGLANR ALFARRLQRE VDHGIEPRND GAPTGGQAAV SVLFLDLDQF 
KRVNDTFGHA TGDELLKIIA ERLRAGTRAN DTVARLGGDE FAVILDGAGP DKPVQMAERL 
AAAVQTPCQL AGQTYLPRAS LGLVTLDPDA RPASPDSLLH QADLAMYAAK RAQTSRLVVY 
DRHLTVRRGR DQPYRH