Gene Franean1_3256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3256
Symbol
ID	5671630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3853798
End bp	3854907
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	72%
IMG OID	641242148
Product	LacI family transcription regulator
Protein accession	YP_001507568
Protein GI	158315060
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.893798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCAGC GTCCGACGAT CTATGATGTG GCCCGCGAGG CGGGGGTCGC CACGTCCACC 
GTCTCGCGGG CCTACGCCCG TCCCGGCCGG GTGGCGGCCG AGACCGCCCG CAGGATCTTC 
GAGGCGGCCG AGCGGCTCGG CTACCGGAGC AGCCGCCTGG ACGGGGGTGG CCCCGCCACC 
GGGGCGACGA AGACGATCGG GCTGGTCATC TCCGACGTCA CGAACCCCTA CTACAACGAG 
ATCATTCGAG GCGCCCACGC CGCCGCCGAG CAGGCCGGTT ATCTGCTGCT GCTCACCCAC 
ACCAGCGAGT CCGCGGCGGT GGAGCGGTGG ACCCTCGAAC GGGAGCTGTC CCAGGTGGAC 
GGCTTCGTCA TCGCCAGCTC ACGGATGAGC GACTCGGCGC TGCGGATGAC AGCCAAGCAG 
AAGGCCGTCA TCCTGCTCAA CCGCACGATC CCCGAGGTCA GCTGTGTGGT GCCGGACAAC 
AGCCACGGGA TCCGCCAGGC CGCCAGTCAC CTGCGCGCGC TCGGCCACGA CAGCGTCCTC 
TACCTGGCCG GCCCGGAGAC GAGCTGGTCG GACGGGATCC GCTGGCGCGC CTTACGGGAG 
GCCGGCCCGG ACCTGGAGCT GGAGATCCGG CGGCTCGGCC CCAACGTTCC CACCATGCGC 
TCCGGTTTCC AGGCCGCGCG CCGGATCGCG GAGATCGGAG CGGGCGCGGT CATCGCCTAC 
AACGACCAGC TCGCCATCGG CGTGATCAAG GGGCTGATCA GCCTGGGCCT CACCGTGCCG 
CACGATGTCA GCATCGTGGG CTTCGACAAC ATCGTCTTCG ACGAGATCGT CGCACCCGGG 
TTGACCACCG TCGCGGCGCC GCTTCACCAG ATGGGCGCGA CGGGCGTGCG CAACTGCGTC 
GCCGTGGCAC GCGGACGGCG CCCGTCCGGA TCGCCGCTGG TGCTGCCGAC GACCCTCGTC 
GAACGAGGCT CCACGGCTGC CCGCCGCGGG CTCTGTTCCC GCCGTCTCGC AGGAGGCCGG 
GTCGCGCCGG GAGGGCCCGC AAGGTCGGGT CTGCCAGCCG GCGCCTCCGA GGCGGTCGCC 
GCGGTGGCGC CCCGCGCCGG GGCATCCTGA

Protein sequence

MHQRPTIYDV AREAGVATST VSRAYARPGR VAAETARRIF EAAERLGYRS SRLDGGGPAT 
GATKTIGLVI SDVTNPYYNE IIRGAHAAAE QAGYLLLLTH TSESAAVERW TLERELSQVD 
GFVIASSRMS DSALRMTAKQ KAVILLNRTI PEVSCVVPDN SHGIRQAASH LRALGHDSVL 
YLAGPETSWS DGIRWRALRE AGPDLELEIR RLGPNVPTMR SGFQAARRIA EIGAGAVIAY 
NDQLAIGVIK GLISLGLTVP HDVSIVGFDN IVFDEIVAPG LTTVAAPLHQ MGATGVRNCV 
AVARGRRPSG SPLVLPTTLV ERGSTAARRG LCSRRLAGGR VAPGGPARSG LPAGASEAVA 
AVAPRAGAS