Gene Franean1_6286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6286
Symbol
ID	5674605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7634331
End bp	7635749
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	69%
IMG OID	641245138
Product	putative HTH-type transcriptional regulator
Protein accession	YP_001510534
Protein GI	158318026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCGCC GTGCACAACC CATGACACAG TGCGTGACAT GGCTGTGGAA GGGTGAGAAC 
TTCTTCTCAG GGGTGAGACA CCTATGTCAC TGCGGCCAGA CGAGGGGGAC CGCCGTGCAT 
GATGCCGACA CGCTGAAACA GCAGCTTGCG GCACGTTTCA GGCAGCTCCA GGGCGAGCAC 
GGCCTCTCCG CGGTGCAACT CGAACAACGC ACGACGTACG ACCGGAAGTA CGTCGGGTGG 
CTCCGGAATC GTGGTCGTCT TCCAGCACGT CATGTCCTGG TCGCGCTCGA CGAGGTGTTC 
GGGACCGGTC AGGAACTCGC CGACCTGGGC GACGAGATCC GCGCAGCGCA GAACGACGAA 
CGGTTGCGGC ACAAGTCAGG CAAGCTGCGG CAGGAACCGG TGCTGGACCA TGAGGGGGTG 
GACCCGACGA ACCGGCGGGA ACTGCTTCAG ACTGGTGCGA TCTCGGCACT CGCCGGGGTC 
GCGGCCGAGC GCAGCGTTGA GGTCGCCAGT GCCGACCTGG CGCCCCCGAA GCTGATCGAA 
ATCGAAGAGG ATATTGATCG GTTCGCGGCC GAATACACCC TGCACCCCCA CGAGATCTTG 
GCCCCGCAGG TGGTCCAGCG CTGGCGGCAG GTAGACGCAG CTCTCGGCCG CCGCGGGTCC 
TGGGCGGCCC GGAGGCGGCT CACCGCCGCC GCTGGACGTC TCACCTACTA CCTGTCCCGG 
CTGGCATTCA ACACCGGAGA TTTCGGGTCC GCGGTGCGTC TCGCAGCCCT CGCCGATCAG 
TACGCCGCGC AGGTCGGTGA CCAGGTCGTG CAGGCGTCGG TCGCCGGGAT GACCTCCGGC 
GTGGCGTTCT ACCGGCACCA GTACGACGAC GCCACGGCAG CTTTCACCGC AGCGGATCCG 
CCGTACCTGC GCGCCCGGAA CGCCGCCTAC CGGGCGAGGG CCTACGCCGC GACCGGCAAT 
GCGGAGCTCG CACAGGCCGA GCTTGACACC ATGTGGTCAT CACAGCTCGC AGGCACCCCC 
CAACCGGGAG ACCTGCCACT CAGCATCGCC GGCGCGGAGA TGTTCACCGC CGTGGCGCTC 
GTCCGTCTGG GCGACGGCAA ACGCGCCGAG CCCCACGCCC GGGAGTCCGT TGCAGGGCAC 
GAGGCATCCG GGCCCGCGGC GCACCCCGAA GAGTTCGGCC ACGCGCTGTG CATGCTCGCG 
AATACGCTTC TTCTGCGCCC CCACCCGGAG CCGGAGGAAG CGGCAGCGCT GGGACGGCGA 
GCGCTCACCG TCCTGAATGG CCATCCCACG CACACCGTGG CCGTCCGCGC ACGTCTGCTC 
GGCGAGGATC TCCGCCCGTT CGCGGCGGTG CCCGCTGTCG CCGAGTTCCG CGAGCTCGCT 
CATACCGCTG GCCGCCCGGC GCTTACCGGG GCACGGTAG

Protein sequence

MSRRAQPMTQ CVTWLWKGEN FFSGVRHLCH CGQTRGTAVH DADTLKQQLA ARFRQLQGEH 
GLSAVQLEQR TTYDRKYVGW LRNRGRLPAR HVLVALDEVF GTGQELADLG DEIRAAQNDE 
RLRHKSGKLR QEPVLDHEGV DPTNRRELLQ TGAISALAGV AAERSVEVAS ADLAPPKLIE 
IEEDIDRFAA EYTLHPHEIL APQVVQRWRQ VDAALGRRGS WAARRRLTAA AGRLTYYLSR 
LAFNTGDFGS AVRLAALADQ YAAQVGDQVV QASVAGMTSG VAFYRHQYDD ATAAFTAADP 
PYLRARNAAY RARAYAATGN AELAQAELDT MWSSQLAGTP QPGDLPLSIA GAEMFTAVAL 
VRLGDGKRAE PHARESVAGH EASGPAAHPE EFGHALCMLA NTLLLRPHPE PEEAAALGRR 
ALTVLNGHPT HTVAVRARLL GEDLRPFAAV PAVAEFRELA HTAGRPALTG AR