Gene Franean1_0436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0436
Symbol
ID	5668859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	517180
End bp	518205
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	71%
IMG OID	641239368
Product	LacI family transcription regulator
Protein accession	YP_001504807
Protein GI	158312299
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.197252
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCTCGA CGCCGGACAG CCAGGAGGCG CGCCGCGTCA CCATCCAGGA CGTGGCACGC 
GAGGCCGGCG TGTCGGTCTC GGCCGTCTCC AAGGTCGTCC GGGACGCGTA TGGCGTCAGC 
GAGGGTATGC GGGAGAAGGT CACCGCCGCC ATCGACGCGC TCGGCTACCG CCCGCACACC 
GGCGCCCGGG CCATGCGCGG CCGCTCGTAC TCCGTCGGCG TGATGCTCAC CGAGCTGACC 
TCGCCGTTCC AGCCGCAGAT CATCAACGGC ATCACGGCAC AGTTCGAGCC GACGCCGTAC 
CAGGAGATCC TGATCGCCGC CGGCACCTCG CCCGACCGGC AGAAGCGCAG CATCGAGGCC 
TTGATCGACC GGCAGGTCGA CGGGCTGATC GTCATCGCGC CCTGGATGGA GCAGGCGTGG 
CTGGAGAAGC TGGGCGCGAG CCTGCCGACG GTCGTGCTGG CCCGGCATGG CGGCTCCGGC 
ACCTTCGACA CGATCGTCGG CGACGACTTC GAGGGCGCCC GCCTCATGGT CGACCGCCTG 
GTGGCCCTCG GGCACCGGCG CATCGTGCAC ACCAGCCAGC CCTCGGGCGG CCTGGAACGC 
CCGTACGTCC TGTCGCACAC GCCACGGCTC GACGGCTACG AGGAGACGAT GCGAAGGCAC 
GGGCTGGAGC CGGACGTCAT CGTCACCAGC TACTCGGAAG AAGGCGGATA CGAGGCCGCC 
CGGCAAGCGC TGGCCCGTCC CATCCCGCCG ACCGCCATCT TCGCCGGCGC GGACATCGCC 
GCGCTGGGCG TGCTGCGCGC GGCCGAGGAA CTCGGGCTGC GGGTTCCGGA AGACCTCAGC 
GTCGCCGGGT ACGACAATAT CTACATGTCG ACGATCGGCC GCATCTCGCT GACCACGATC 
GACCAGTCGG CCCAGCTCAC CGGTTCCCGC AGCGCCCGGT TGCTGCTGGA GCGCATCGAC 
GGCCGCACCC AACCGGTGCA CTACCTCATC GCGCCGCGCC TGGTGGCTCG CGACACGACC 
GCCTGA

Protein sequence

MVSTPDSQEA RRVTIQDVAR EAGVSVSAVS KVVRDAYGVS EGMREKVTAA IDALGYRPHT 
GARAMRGRSY SVGVMLTELT SPFQPQIING ITAQFEPTPY QEILIAAGTS PDRQKRSIEA 
LIDRQVDGLI VIAPWMEQAW LEKLGASLPT VVLARHGGSG TFDTIVGDDF EGARLMVDRL 
VALGHRRIVH TSQPSGGLER PYVLSHTPRL DGYEETMRRH GLEPDVIVTS YSEEGGYEAA 
RQALARPIPP TAIFAGADIA ALGVLRAAEE LGLRVPEDLS VAGYDNIYMS TIGRISLTTI 
DQSAQLTGSR SARLLLERID GRTQPVHYLI APRLVARDTT A