Gene Franean1_6107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6107
Symbol
ID	5674428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7435218
End bp	7436387
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	74%
IMG OID	641244959
Product	XRE family transcriptional regulator
Protein accession	YP_001510357
Protein GI	158317849
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0526222
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCAAC GGAGCCGAGG CCGGCAGGGT TCGAGTACCG CGGAGGACAT CCTCCCGACG 
GAGATCCGGC GGCGCCGGTG TGAGCGCGGC CTGTCCCGCG ACGAACTGGC CGGGCGGACC 
GGATACAGCC GCCAGTACAT CGGCCAGCTG GAACAGCCCA GCCGGGGCAT ACCGGCGCGG 
CCGGTCCTCG CCGCGGTCGA CGCGGCCCTG GAGGCCGGGG GCGCGCTCGT CGACCTGCGC 
GAGGCCGCCA TCGCCGAGCG CACCGAGCGG CACCGCCGCC AGCCCGACGC GGAGATCGAG 
TCCCGCCGGC GGATCGGTGA CCTCCTCGAC CACCGGCGCT CCGACCGCGA GCTCGACTAT 
CTCGACCGGC TCGCCGCCGA CCTCATCGCG GCGGCCGACC TGCTGGACCC GGCCGACCTC 
ACCGCCCAGG TCCTCGACCA GCAGGCCTTC GTCGACCAGC TCCTGCGCAC CCCGATGCTG 
CCGCACCAGC AGTTCCGCCT CTTCATGATC GCGGGCCACC TGGCCGGGCT GCTGGCCATC 
TCCCTGCTCG ACATGGACGA GCTCGCGAAG GCCAGCACCT GCTGCCTGGA GGCCGCGGTG 
TTCACCGAGC TGACCGGCCA CGAGGGCCTG CGTGCGTGGA CGCTCGCCGT CAACAGCCTC 
ATCGACGCGG CCGCCCGGCA CGCCGAGGAG TCCGAGCCCG CGGCGGGGCG GGCCGGGCTC 
GACGGCCGCC GAGCGGAGCA GGGGCTGGTG GCGACGCGCT CCGCCGGTTC GGATCTACGG 
GCCGGCACCC GCGCGGCCCG TACCGGCGCG GCGGACAGCC AGGACGGGGT CGACCACCCG 
CTCGAATCCA CCGCCGATCA CGCTGGGTAC GTGGAGGGCC GGGGGCGCGG CGCCGGCATC 
GCACCTTCGG GTGGCGCGGC CGCCCCGCGC TCGACCTGGA ACCACCAGCA GAGCGACGGA 
GTACCGTCAC TGTCCGCGAC AGGCGTGGGC GCCGCCGCAG CCGCGCAACA ACCGAACCTG 
GACGAGATGC TGATTGCGCC GGGTGGCCGG GCGACACCGC CTCGGCTCAT CGCTCTCGTC 
AAAAGCCGGA TCGCGCGTTT CGCGACGGCC AGCGCGCAGC GGGCCACACC CCCGGTGGGT 
ATCTCCCAGG CATTCCGGCC GCCTGTCTAA

Protein sequence

MRQRSRGRQG SSTAEDILPT EIRRRRCERG LSRDELAGRT GYSRQYIGQL EQPSRGIPAR 
PVLAAVDAAL EAGGALVDLR EAAIAERTER HRRQPDAEIE SRRRIGDLLD HRRSDRELDY 
LDRLAADLIA AADLLDPADL TAQVLDQQAF VDQLLRTPML PHQQFRLFMI AGHLAGLLAI 
SLLDMDELAK ASTCCLEAAV FTELTGHEGL RAWTLAVNSL IDAAARHAEE SEPAAGRAGL 
DGRRAEQGLV ATRSAGSDLR AGTRAARTGA ADSQDGVDHP LESTADHAGY VEGRGRGAGI 
APSGGAAAPR STWNHQQSDG VPSLSATGVG AAAAAQQPNL DEMLIAPGGR ATPPRLIALV 
KSRIARFATA SAQRATPPVG ISQAFRPPV