Gene Franean1_5545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5545
Symbol
ID	5673875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6712760
End bp	6714091
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	70%
IMG OID	641244401
Product	XRE family transcriptional regulator
Protein accession	YP_001509805
Protein GI	158317297
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGTC GCCGCCCGCT ACCCACCGCA CCGACTGGCC TGTGGGACCG CCCCGAGATG 
GCCCAGGCCC TCACCGCACG CGATATGAAG ACCGTGCTGG AGATCTACCG GAAGTGGACC 
GGTGCCTCCC AGACGCAGAT CGCCGCCATG ACCGGCATCG CGCAGCCGTC CATCAGCGCG 
ATTTTCGGCG GGAAACGCCA GGTCACCACC ATCGAAAGCT TCGAGAAGTT CGCCGACGGA 
CTCGGCATCC CCCGCGAACG TCTCGGACTC GCGGCCCTGA AGACCGCAGC TCCGGACACC 
GCCGACAGCG CGACGAGTCC GGATCGGCGT AGCGTGCTCG CCGCCGGTGC ACTGTTCGCG 
ATCGACGCGG AGTTGGACGA GGTCACCCGC CGGATGCAGC AGGTCGCCGC GTCCAACGTC 
GATGACGACG CGCTGCAGCA GCTCGACATC AGCATCGAGG TTGTCGGTCG CCGCTACGAG 
AACAGCGACG CCGCCACCGT CTACCCCGTC GCGTTGAAGC AGCGCCGGTG GGTCGCCGAC 
CTCATGGGCG GGCACCAGCA CCCCGACCAG CGCCGCGAGT TGTACGCCAT CGGCGGGAAG 
CTCTCCGGCC TGCTCGGCTA TCTCGCGTTC GATCTCGGGA ACGAGCTGGT CGCCCGCGCC 
TACTGCAACG AGGCGATGAG CCTTGCCAAG ACCGCCGGAC ACCGTGATCT CGCCGCGTGG 
GTCCGCGGCA CCCAAAGCTT CATCGCTTAC TACGGCGGTC GGTACCGCGA AGCCCTGGAC 
CTGGCCCGCG ACGGCCAGCG CTACGCCCGC GGTGGCCCCG CCAGCATCCG ACTCGCCATC 
AGCGGCGAAG CCCGCACCCT GGGCAAGCTC GGCGACATCG CCGGAGTCGA CGAGGCCGTC 
GGGCGTGTTC TGGCTGCCCA TGCCCGGATC GAGGACACCG ACCCCGTCGG CTACTTCCTG 
TCGTTCGAAC CGTTCACCGC GTCCCGCATC GCCGGCAACG CTGCGTCCGC CTATCTCGCC 
GCCGGTGCCC CCGACCGGGC CCGCGAGTTC ACGGATCAGG CCATCCCCAT CTTCGCCGCC 
GCCGGGTCCA CGGCCAGCCA CGCCCTGACC CTGGTGGACG CGAGCATGAC CTACCTTTCC 
GGCCCCGACG CCCAACCGGA CCGCGCCGGA GCTCTCGTTG CCGAAGCGCT GGACGTCGGC 
GCCGATCTGC GGTCCGAAGT GGTCGCCCGC CGGGCCCGGG ACTTCCTGCT CACCGCCGCC 
CAGTGGCGCA CCGTCCCCGA GATCGCCCAG GTCAACGACG CCGTCAAAGC CTGGAGACTG 
CCCACCAGCT GA

Protein sequence

MTRRRPLPTA PTGLWDRPEM AQALTARDMK TVLEIYRKWT GASQTQIAAM TGIAQPSISA 
IFGGKRQVTT IESFEKFADG LGIPRERLGL AALKTAAPDT ADSATSPDRR SVLAAGALFA 
IDAELDEVTR RMQQVAASNV DDDALQQLDI SIEVVGRRYE NSDAATVYPV ALKQRRWVAD 
LMGGHQHPDQ RRELYAIGGK LSGLLGYLAF DLGNELVARA YCNEAMSLAK TAGHRDLAAW 
VRGTQSFIAY YGGRYREALD LARDGQRYAR GGPASIRLAI SGEARTLGKL GDIAGVDEAV 
GRVLAAHARI EDTDPVGYFL SFEPFTASRI AGNAASAYLA AGAPDRAREF TDQAIPIFAA 
AGSTASHALT LVDASMTYLS GPDAQPDRAG ALVAEALDVG ADLRSEVVAR RARDFLLTAA 
QWRTVPEIAQ VNDAVKAWRL PTS