Gene Franean1_5332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5332
Symbol
ID	5673666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6422023
End bp	6423201
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	69%
IMG OID	641244190
Product	XRE family transcriptional regulator
Protein accession	YP_001509596
Protein GI	158317088
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0406632
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCATA CCTGGCGGGT CTCACCCGGT TCGAAGCGGA CGATGCCGAA CAGCAGCGGC 
CCGGGATCAC CTCCACCTGC TCTGTCTGCT CTGTCGAACA TCACGTTCCG TCCTCCTGTG 
TTGGATCGTG GGCGACGAGG CACCGGAACC GACCCGCGAA GGTGTTCGAC CTGCGGCGGA 
TCTGGTGCCC GCCCACCGTC CAACCGGACG GCTTGTCACG GAAGGCCGCC GGCCGTATAC 
GCCGAGGGTT CCGATCTATA CGGAGACCGG ATAGGCTCTG CGCGTCCGAT CAAGGACAGA 
CGGTCCTGTA CCTACCGTCC GGAGGCGCCC GTGGTTTCCG TCCGCCGCCC GTTACCCCAG 
GCCCCGCCGG GACTCTGGGA CCGGCCAGAG ATGGCCGACG CACTCGCCCG CCGTGACATC 
GGCACCGTCT TCAAGATCTA CCGCCAGTGG ACCGGCGCGA CCCAGACACA GATCGCCGCT 
GTCTGCGGCC TCCCGCAGTC CCACGTCAGC GAGATCTCAA CCGGCCGCCG CCAGGTCACC 
AGCCTGGAGA TCTTCGAGCG CATCGCCGAC GGCATCGACA TCCCCCGGGG CCGCATCGGA 
CTTGCCGAAA GACCCGGCGC CGTCCCTGAG CCACGGACCG AGCCCGGAGC GCCCGTCGTC 
AACGTGCCCG GCGACATCGT GCACGTCTAT CCCAGCCGGA CAGCCGTCCC GTCCGAGCTG 
TGGCGGACGC TGTTCGCCGG CGCGCGCCAC CAGGTCGACG TCCTCGTGAT CGCCGGCCTG 
TTCCTCCCCG ACGGCCACGC CGACTTCACC ACCGTCCTCC GCCACAAAGG CGCGGAAGGC 
GTCACGATCC GCTACGCACT CGGCGACCCC GAATCACCCG CCGTCGCTCT CCGCGGCGAA 
GAGGAAGGGA TCGGCGACGG GCTCGCCGCC CGGACCCGGA TCACGCTCAC CTACCTCGCG 
TCCCTCCGCG AGGCGCCCGG GATCGAGCTA CGGCTCCACG CCACCACGCT CTACAACTCC 
ATCTACCGGT TCGACGGCGA CATGCTCGTC AACACCCACG TGTACGGCGC CCCCGCCGCG 
CACTCCCCCG TCATGCACCT ACGCGCCCAG TCCGGTGGCC TGTTCGACCA CTACGCCGCC 
AGCTTCGAGC GCATCTGGGC CACCACCGAA GGAGCCTGA

Protein sequence

MSHTWRVSPG SKRTMPNSSG PGSPPPALSA LSNITFRPPV LDRGRRGTGT DPRRCSTCGG 
SGARPPSNRT ACHGRPPAVY AEGSDLYGDR IGSARPIKDR RSCTYRPEAP VVSVRRPLPQ 
APPGLWDRPE MADALARRDI GTVFKIYRQW TGATQTQIAA VCGLPQSHVS EISTGRRQVT 
SLEIFERIAD GIDIPRGRIG LAERPGAVPE PRTEPGAPVV NVPGDIVHVY PSRTAVPSEL 
WRTLFAGARH QVDVLVIAGL FLPDGHADFT TVLRHKGAEG VTIRYALGDP ESPAVALRGE 
EEGIGDGLAA RTRITLTYLA SLREAPGIEL RLHATTLYNS IYRFDGDMLV NTHVYGAPAA 
HSPVMHLRAQ SGGLFDHYAA SFERIWATTE GA