Gene Franean1_4627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4627
Symbol
ID	5672971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5517176
End bp	5518933
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	67%
IMG OID	641243486
Product	diguanylate cyclase with PAS/PAC sensor
Protein accession	YP_001508902
Protein GI	158316394
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGCGAC AGGGGGGAGA AGGCTCGGGT CTGTTCGACC TGATGGAGAT CGGGCTGGGC 
ATCATTGGGG TCGCCGATTA TCGGGTGCGC AGGGTGAATC AGGCCACGTG CCGGATCCTC 
GGACGGAACG AGGATGAACT CGTTGGTGTC CGGTGGGAGA CGCTGGTCCA TCCAGATGAC 
CGGGAGGCTC ACCTGGCAGA AGCGCGACAG AACCAGGCCG CTGGCCAGAC CCACTGGCAG 
GGCGTCGTCC GCTTCGTGCA GCCGAGCGGG TCTGTCGTGT ACGTTCTGGC GACGTCGGTG 
ATCCTGACCG ACGACGTGCC CCCCGCGGAA GCCGAACGGC CCTATTTCCT CGTCCAGTTC 
CAGGATCTCA GCCAGCAGTT GGCGTCGCAC CGCCACCTTC GGCTCGTCAT GGAAAACACC 
CCAGTCACCC TGGCCCTGGT CGACAGGGAC GGCTGCGTCC TGTTCAACGA GGGTGCGATA 
GGCGAAGACG CGGTCCGACG CCTGGAGATC GCGCGGCGGC GCAGCATCTT CGAGGTCTTC 
CGAGATCTAC CTGATGCCCT GGATCTGACC CGCCGAGCGC TGGCAGGCCA GCGCGCCTGC 
GGCGTCTTCT CCGCCTACGG ACACTGGTAC GAATCACAAA CGGTTCCGAT CTGCGATGCG 
CAGGGTGTCG TGCAGTCGGT CGCCATCGTG TCCCACGACG TGACCGAGCG GGAGATCGCA 
CTGGCCGAGC TGCGCGCCCG ATCTGCTGAA CAGTCACTGG TGGCGAAGAT CGGGCGGTGC 
GCGCTGGGCA GCCCCGATCC GGCATCTCTC TGGCATCAGG CGACGACAGC GATCTCAGGC 
CACCTGTGTG CCGATCAGGT GACTATCAGG GCGGCCGATC CGGACTCCGG TCTACCACAC 
GTCGTTGCCA CGGCTGGTTC GGCGGCACCG TATTACCCGT CTCCCCCACC ATCAGCCGCG 
CCGGACGGAA CGGCGCTCGC GGGCAGCCGT ACCGACCCGC CCCGTGGGAT CGCGGCGGAC 
AGCGCGTCCT CATCCCTGAC CATCCCGATC GGCCAGCCTG ACAACCCCGG CGCTCTGCTC 
ACCATCGACC GCCGCAACCC CGGTTCCTTC GCGCGTCATG AGGTGATGTT TCTCGAGATG 
ATGGCGACCG TGCTGGCAGC GGCCGACGAG CGCTTCCGCA TCGAACGTGA CGCCCAATAT 
CAGGCCCGGC ACGACGGGCT CACCGGGCTA CCGAACCGAA CCGCGTTCCT GGACCACCTG 
CAGCGGACCC TGACCCGTGC CGGACACGAC CGCCGTCGCA CCGGGCTCCT GTTTATCGAC 
CTCGACAACT TCAAGAAGGT CAACGATTCG TACGGTCACC AGACCGGCGA CGACCTGCTC 
CGCGAGGTGG CCGCCCGGCT CCAGCGGGCC GTCCGTCCCG AGGACAGCGT CGCCCGCCTC 
TCCGGTGACG AGTTCGCTGT GCTCTGCGAC CGCGACCCCG CGTTACCCGA CGTCCAGGCC 
ATCGCCCGGC GCATCGTCAC CACCCTCGCC ACCCCACGGA TCGTTCTCGC TGGCCAGCCG 
ATCACGGTCG CCGCCAGCAT CGGGATCGCG CACTCCGACG GCCAGCCCAT CGACGCCGAC 
GAATTCCTGT GTACTGCCGA CATGGCGATG TACGCGGCGA AGCGGCAGGG TCCAGGTCGC 
TTCCTTGTCT TTGACGAGTC GATGCGGACC CACATTCGCC GCCGATTCGA CACAAGAACA 
ACAGCCGGTG GACGCTGA

Protein sequence

MVRQGGEGSG LFDLMEIGLG IIGVADYRVR RVNQATCRIL GRNEDELVGV RWETLVHPDD 
REAHLAEARQ NQAAGQTHWQ GVVRFVQPSG SVVYVLATSV ILTDDVPPAE AERPYFLVQF 
QDLSQQLASH RHLRLVMENT PVTLALVDRD GCVLFNEGAI GEDAVRRLEI ARRRSIFEVF 
RDLPDALDLT RRALAGQRAC GVFSAYGHWY ESQTVPICDA QGVVQSVAIV SHDVTEREIA 
LAELRARSAE QSLVAKIGRC ALGSPDPASL WHQATTAISG HLCADQVTIR AADPDSGLPH 
VVATAGSAAP YYPSPPPSAA PDGTALAGSR TDPPRGIAAD SASSSLTIPI GQPDNPGALL 
TIDRRNPGSF ARHEVMFLEM MATVLAAADE RFRIERDAQY QARHDGLTGL PNRTAFLDHL 
QRTLTRAGHD RRRTGLLFID LDNFKKVNDS YGHQTGDDLL REVAARLQRA VRPEDSVARL 
SGDEFAVLCD RDPALPDVQA IARRIVTTLA TPRIVLAGQP ITVAASIGIA HSDGQPIDAD 
EFLCTADMAM YAAKRQGPGR FLVFDESMRT HIRRRFDTRT TAGGR