Gene Francci3_4158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4158
Symbol
ID	3907123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4959583
End bp	4960794
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	60%
IMG OID	637881486
Product	XRE family transcriptional regulator
Protein accession	YP_483235
Protein GI	86742835
COG category	[K] Transcription
COG ID	[COG1396] Predicted transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0178123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGAGA TCCGGGCTCT GGGCGACCGG GTCGCTCAAG TACGTGTACG CCGTTCGATG 
ACACAGACCG AGCTTGCCGA GCGTGCAGGC GTGTCTACCG ACCTGGTTAC GAAGCTGGAG 
CAGGGCCAGC GTGACGGCAT ACGCATCTCT ACGTTGCACA GCCTTGCTAG GGCCTTGGAC 
GTTCCTACCG CTACGTTCTT TGAGGTGGAG CAGGAGGAGA CGGTGAGCGA TAATGAGGCC 
TTCATACCGC TTCGGAAACT GTTGCTCCCT GGACCTTCCA GCGGGCAAAC CGACGAACCG 
GCCCTATCGC TCCAACCGTT GCGGCAACGT CTGGTGGCGC TGACCCAGGA CTACCATTAT 
GCGCGGTATC CGCAGGCCGT TCGGACCGCT CCAGAACTGA TCGAGGACAT CACTGCCGCC 
ACGGGCATAC ACCAGGAGGA GGACCAGAAG AGTATATATC GCCTGCTGGC GCACGCCTAC 
ATTATGGCTG CCTCGATTCT CATCCAGCTT AGCGGGGAGG ACTTGGCTTG CGAGGCCATA 
CGCCGGAGCA TGGAAGCGGC GGAGCAAGCC GGAGACCCGA TTCTCCGTGC AAGCGGAGTG 
GTGTACTACC GGTGGGCATT CATCCGCCAA GGCCGATTCG ACGATGCCGA AAAGGTGGCC 
GTCGACATGG CCACCGAGAT CGAGCCAAGC ATCATGTCAG CAACCCCCGA ACACCTTGCA 
GTATGGGGGA GACTGCTGAC CGGCGCCTCT GCCGCCGCAG CTCGGAACAA CCGTCCGGAA 
ACAGCGAAAG ACCTACTTTC GTATGCCCGT AGCTCAGCCG CGCGTGTAGC CGACGGAAAA 
ATGGACTACG CTAAGTACTG GGCGGCGTTC GGACCGAGTC AAGTCGACGC AATCGAGGTC 
GAAAATGCCA TGACGCAAGG CGATGCGCCC CGTGCATTGA CTCTGGCCCG GAGGGTCCGT 
CGGACTGAGA ACATGCCACT GAGCAACTGG ACACGTCACC TTCTCGCTGT GGCCGAGGCA 
CAAACGGCCA CAAGAGACTA CGCGAGTGCC ATTCAGACAG TTCAAGATGT CTACACTCTC 
ACCCCGGAAT GGCTACGGGA GCAGCGCCTA GCCAGCAGAC TAATACGCGA CCTACTAGAC 
GCTACGAGCG TCCGAAGAGC CCGAAAGACC GGTCTAGCCG ACCTGGCTAC ATTTGTGGGC 
ATCAAGCCGT AG

Protein sequence

MTEIRALGDR VAQVRVRRSM TQTELAERAG VSTDLVTKLE QGQRDGIRIS TLHSLARALD 
VPTATFFEVE QEETVSDNEA FIPLRKLLLP GPSSGQTDEP ALSLQPLRQR LVALTQDYHY 
ARYPQAVRTA PELIEDITAA TGIHQEEDQK SIYRLLAHAY IMAASILIQL SGEDLACEAI 
RRSMEAAEQA GDPILRASGV VYYRWAFIRQ GRFDDAEKVA VDMATEIEPS IMSATPEHLA 
VWGRLLTGAS AAAARNNRPE TAKDLLSYAR SSAARVADGK MDYAKYWAAF GPSQVDAIEV 
ENAMTQGDAP RALTLARRVR RTENMPLSNW TRHLLAVAEA QTATRDYASA IQTVQDVYTL 
TPEWLREQRL ASRLIRDLLD ATSVRRARKT GLADLATFVG IKP