Gene Franean1_2051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2051
Symbol
ID	5670452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2469864
End bp	2471444
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	78%
IMG OID	641240973
Product	PucR family transcriptional regulator
Protein accession	YP_001506394
Protein GI	158313886
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.4241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGCGG CGGCCGACGC CCGCCTGCAC GCCGGCCTGC TGGGCAACTA TCTGGAGGTG 
CTCGCCTCCG CGGCCGACAG CGGCCGGCGG CTGTCCCGCG CCGAGCTCGA CGTCTTCCGG 
GCGCTCGGCC AGGCCGCCGC CGAGTCCGGC GCCTCGCTGC CGGCGCTCGT CGACCTCTAC 
CTCTCCGCGA CCTGGCGGAT CTGGCCGTCG CTGCCCGTCG TCCGCCAGGC CGACCGGGAC 
GCGCGCGACC TGGGACGGAC GCTGCCGGCG GTCCTGGACG GGCGGGTGCC GGCCGTCGCC 
CACGCCGAGC ACTCCCAGCA CACCGAGGAC GGCGGTGATC CCACCGATCT CAGCGGGCTG 
ACCGTCGGGG CGGTCTCGCG AACCCGCGCG GCGGCGTCGG CCGTCCTGCG GGCCAGCGAC 
GACGCGGTCG CGGCGGTGTG CGAGGGCTAC GAACGGGCCC GCGCGGCGCG GGCGCGCTCG 
GAGGAGGCGA TGCGCCGCGA GCTGGTGGAC GACCTGCTCA CCGGCACCTC CGAGCTCGGG 
CCGCTGCTCG AGCGGGCGGC CGCCTTCGGG CTCCGGCTGG AGGCGCCACA CGTCGTCCTC 
GTCGCGGCGG GCGGGCGGCG CTTCCTGGAC GGGCGGGCGG TCGTGCGCGG GATCGAGGAG 
GCGCTGCGCG CGCAGTGCGC CACGGAGCCC CTCGTCGCGA CCAAGGACGG GCTGCTCGTC 
TGCGTCGTCC CGCAGGAGAC CGACCTGACC CTGCCCGTCC CGCCCACGGC GGCGATCACG 
CCGGACGACG GCGCCGCACC GGACCGCCGC CCCGCCGCCG GCCCGACGGC CGGGTCGGCC 
AGGGCCGGGG TGACCAGCGT GAGCGATCCC GCGTCGGGAC GTCACCATCC TGTGCATCAC 
CCCGTGCACG CCCGGCCGGA CGGCGGCTCC GGGCACCCGA GGGCCGACCG GCCGACCCTC 
GACCGGGAGA TCGCACGCCC ACGGGCCACG GCGCCGCGGG GCCGGCGCCG GATGGACCCG 
CCCGGCCCCG GCGACGCCGG GTTCGCGCCG CTGCCGGCGT TCTCCCCCGC GGACGCGGCG 
CCGTCCACCG CCATCAGGGC GGTCATCGGG CGGCTGGGGG TGGAACCGGA GCTCGTGTGG 
CGGCTTGGGG TCAGCCGGCC CCGCAGCGGC GTCGCCGGCG TGCGCATCGG CTATGAGGAG 
GCCCGCAACG CCGTCGAGCT GGCCGGGCGG ATGCGGCTGG ACGGGCAGGT CGTGCACGCC 
GACGACCTGC TCATCTACAA GGTGCTGCTC CGCGACCGGG AACCGCTGGA GGAGCTCGTC 
GAGGCGGTGC TCAGCCCGCT GCGGGCGGCG CGGGGCGGCG CGGGGCCGCT GATCGAGACG 
CTCGACGCCT ACTTCGCGAC CGGCGGCGTG GCGCTCGCGG CGGCCCGCCG GTTGCACCTG 
TCGGTGCGCG CGCTCACCTA CCGGCTCGAC CGCATCCACG CCCTGACCAG GCATGACCCG 
ACCTCTCCGA CGGACCGGTA CGTCCTGCAG ACCGCGGTGC TCGGTGCCCG GCTGCTCGGC 
TGGGAGGGCA CCTCGCGCTG A

Protein sequence

MLAAADARLH AGLLGNYLEV LASAADSGRR LSRAELDVFR ALGQAAAESG ASLPALVDLY 
LSATWRIWPS LPVVRQADRD ARDLGRTLPA VLDGRVPAVA HAEHSQHTED GGDPTDLSGL 
TVGAVSRTRA AASAVLRASD DAVAAVCEGY ERARAARARS EEAMRRELVD DLLTGTSELG 
PLLERAAAFG LRLEAPHVVL VAAGGRRFLD GRAVVRGIEE ALRAQCATEP LVATKDGLLV 
CVVPQETDLT LPVPPTAAIT PDDGAAPDRR PAAGPTAGSA RAGVTSVSDP ASGRHHPVHH 
PVHARPDGGS GHPRADRPTL DREIARPRAT APRGRRRMDP PGPGDAGFAP LPAFSPADAA 
PSTAIRAVIG RLGVEPELVW RLGVSRPRSG VAGVRIGYEE ARNAVELAGR MRLDGQVVHA 
DDLLIYKVLL RDREPLEELV EAVLSPLRAA RGGAGPLIET LDAYFATGGV ALAAARRLHL 
SVRALTYRLD RIHALTRHDP TSPTDRYVLQ TAVLGARLLG WEGTSR