Gene Francci3_3308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3308
Symbol
ID	3904094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3918960
End bp	3920462
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	68%
IMG OID	637880633
Product	XRE family transcriptional regulator
Protein accession	YP_482394
Protein GI	86741994
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.032044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.303399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGGAGG CTGAGCGGCA GCGAAACGAC ACCTTGGACG AGCTGGTGGC CCTACTCCAA 
CAATTGATCA AGAAATCTGG TACCAACAGG ACGCGGCTGG CCGAGCGGAC AGGATTCCCT 
CGCCAGCAAG TTTCCCGGGC AGTCAACGGC CGTGAGGTAC CATCGCCGGA CCTCGCCGAC 
GCATTCGACG TCGTGTTCGG TTGCAACGGG AGGATTCGTC ACCTTCGGGA TGAGGCACAC 
AGAGAGAAGC GGGCGCGACG TCTCGGCGCC GAACCGCCCC GACGGGACAA GGCGCAGCCG 
TCCCCGCAAA GCAGCGTCCC GAAGGAAGGG CAGGAGTTAG GGCTACAGGC CACGCTACCC 
ATCACACCGA GCCCGCTGCC TGGACGAGGA CCAAGCAACG GGCCCATAGG CGTAGGTGAC 
CCAAGGGAGG CGAGAGCCAC GGACAGACGC GACGCCCTAC GCGCCATGGC GCTGGGGACC 
GCGGCACTCG GCCCGGTCGC GGCGGACCTC TCCCGCAGCA TCGCCGGGGC CGACCCGGAC 
CCCCTCAGTG TCGACCTAGC CGAAGCGCAT ATCCACCGCA TCGCCGCCGC CTACCGCGTC 
ACTCCCCATG GCGAACTCAT GGACGCCCTC GGCCCGGAAT GGCAGAACAT CGAACGCATC 
CTCGACCGCC GTGTCTCGCC GCCGGTGCGC GCTCGCCTCA CGTTGATCGC CGGACAGTAC 
GCCTTCTACC TCGGTACGCT CGCCTTCGAT CTCGGCGACG ACGACACCGC ACGCAGTCTT 
CTCCGGGTCG CCAGCCAACA CGCCGACGAG ACGAAACAAC TCCTGCCTGC CCGCTCTCCA 
CGCCGATCCG ACGTCCTGTT GCTCGACGGA TCCGTCGCAG CGATCCGTTC CAGCGTCGCC 
TACTTCAACC GCGCGTACAG CGAAGCCGCC GACATCGCCG CCCAGGCACG GGAAGGCGCC 
CATCCGTTCG CCCTGCCGAT CCTCGCCGGC TGCGAGGCAC GGGCCGCGGC GCTCGCGCAC 
CGACCCGACG ACGCCCGCGC CGCCTTGGCC GACATGCAAG AGCATCTTTG GGACGGCGCA 
GTCATGCCCG GCCCGAACCC GGGGGACGCC GCGTTCATAC ACGGCTTCCT CGCCGTCGCG 
CTCGCCCACG TCGGCGACGG TGTTCAAGCC GAGCAGCATG CCCGTGTCGG CCTGGATCTG 
GAGATCGCGG CCAACCCCGA CCATTATGTG CAGATCGGCG GGAAACACAA CGCCCTCTGC 
CGCGCCTACC TCCGCCGCCC CGAACCGGAT CCGGAAGCCG CCGCAGACGC CGCGCGTCAC 
GCACTCCTCA CGGTGGACGG ACGACCCAAT CGGACAGTTA TCCAGCAGGC AGGCCAGATG 
TGGAGACAGA TGGACGGTAA ATGGCCCGAG CTCCCCACGG TCCGTGACCT CGGCGAGATA 
GTACAAACCT CCAGACGAGC CCTCGAATCC GGACCGGGAG ATCCTGCGTC CGCCTGCGCC 
TGA

Protein sequence

MLEAERQRND TLDELVALLQ QLIKKSGTNR TRLAERTGFP RQQVSRAVNG REVPSPDLAD 
AFDVVFGCNG RIRHLRDEAH REKRARRLGA EPPRRDKAQP SPQSSVPKEG QELGLQATLP 
ITPSPLPGRG PSNGPIGVGD PREARATDRR DALRAMALGT AALGPVAADL SRSIAGADPD 
PLSVDLAEAH IHRIAAAYRV TPHGELMDAL GPEWQNIERI LDRRVSPPVR ARLTLIAGQY 
AFYLGTLAFD LGDDDTARSL LRVASQHADE TKQLLPARSP RRSDVLLLDG SVAAIRSSVA 
YFNRAYSEAA DIAAQAREGA HPFALPILAG CEARAAALAH RPDDARAALA DMQEHLWDGA 
VMPGPNPGDA AFIHGFLAVA LAHVGDGVQA EQHARVGLDL EIAANPDHYV QIGGKHNALC 
RAYLRRPEPD PEAAADAARH ALLTVDGRPN RTVIQQAGQM WRQMDGKWPE LPTVRDLGEI 
VQTSRRALES GPGDPASACA