Gene Francci3_1767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1767
Symbol
ID	3906833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2101640
End bp	2102752
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	71%
IMG OID	637879105
Product	LacI family transcription regulator
Protein accession	YP_480872
Protein GI	86740472
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.255777
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCA GGACTCAAGC CACTGAACTG GCCGCTCGGC TGCCGGCCGG CCCGACTGTG 
CGCGAGCGTG AGCCGGTGGC GGGCGGGCGG GTCACCCGCG ACGACGTGGC GCGGTTGGCG 
GGCACCTCGA CGGCAGTGGT CAGCTACGTG GTCAACGGTG GCCCGCGACC GGTCGCGGGC 
GCCACGAGGG CCAGAGTGCT AGCTGCGATT GAGCAACTGG GGTACCGGCC CAACGCCCTG 
GCCCGAGGGC TGAGCATGCG CGGGGTAATG CTGCTGGGGC TGGTGGTGCC CGACGCAGCC 
AACCCGTTCT TCGCACGGTT AGTCCACGCG GTCGAGCGGG CAGCGGCCCG CCGGGGACAC 
CTGTTGCTGG TAGGCAACAC GGCGTTTTCC CCTAGCGCGG AAGAGCACTA CCTTGACGCA 
TTCTCACGGC TCTCCCCCGC CGCGCTCATC GTAGTCAACT CCGCGGATAC CCCCGGGATC 
CGACACGTCC TGTCGATGCT GGACTGCCGA GTGGTGCTGC TCCACAAGCG AGTCATCGGC 
TTCCACGGGC CGCTGGTCAT CGGCGACGAC TACCGAGGGG GCTGGCTGGC CGCCGAGCAC 
CTGGTCGGCC ATGGCCGTAA GAGGCCGCTG TGTCTGAGCG GTCCGGACCG GGAGTCCCCG 
GTGGCCGACC GCGAGCGGGG GTTCTCCGCC GCGCTGCGGG CTGCGGGCGC CCCCGTCACC 
TCGGTGCTGC GCAGCGGCTT CCTCCGTGCC GAGGCCATGC GCGCTACGCT GGCGGCCATA 
GCGGGCAGCT ACCAGCCGGA CGCGATCTTC GCTACCACCG AGGAGCATGC GCACGGGGTG 
CTCGCTGCGG CGCGGGCTGC GGGGGTGCGG GTGCCCGACG ACCTGGCCGT GCTGGCCATG 
GACGGGCTAC CGGAAGGTGA GTTCGCCGCG CCGCCGTTGT CGACCGTGGC GGTAGACATC 
GCGGGCTTCG CCGATATGGC GGTAAACGAG GCCCTGAACC CCGGACCGGG CGACACCCGG 
GTAACCGTCT TCGGCGTGCG GCTGGTTCCG CGTCTCAGCT GCGGGTGCGC CCCGGCGCCC 
GCTCGGACCA GTACGTCCAC TACGGACGTC TGA

Protein sequence

MTIRTQATEL AARLPAGPTV REREPVAGGR VTRDDVARLA GTSTAVVSYV VNGGPRPVAG 
ATRARVLAAI EQLGYRPNAL ARGLSMRGVM LLGLVVPDAA NPFFARLVHA VERAAARRGH 
LLLVGNTAFS PSAEEHYLDA FSRLSPAALI VVNSADTPGI RHVLSMLDCR VVLLHKRVIG 
FHGPLVIGDD YRGGWLAAEH LVGHGRKRPL CLSGPDRESP VADRERGFSA ALRAAGAPVT 
SVLRSGFLRA EAMRATLAAI AGSYQPDAIF ATTEEHAHGV LAAARAAGVR VPDDLAVLAM 
DGLPEGEFAA PPLSTVAVDI AGFADMAVNE ALNPGPGDTR VTVFGVRLVP RLSCGCAPAP 
ARTSTSTTDV