Gene Francci3_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1022
Symbol
ID	3906264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1216285
End bp	1217610
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID	637878355
Product	XRE family transcriptional regulator
Protein accession	YP_480134
Protein GI	86739734
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.842716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.936661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGTC GCCGCCCACT ACCCACCGCA CCGACCGGCC TGTGGGACCG CCCCGAGATG 
GCCCAGGCCC TCACCGCACG GGACATGCAG ACCGTGCTGG CGATCTACCG GAAGTGGACC 
GGTGCCTCCC AGTCGCAGAT AGCCGCCATG ACCGGCATCC CGCAGCCGTC CATCAGCGTG 
ATTGTCCGCG GGAAACGCCA GGTCACCACC ATCGAGAACT TCGAGAAGTT CGCCGACGGA 
CTCGGCATCC CCCGAGACCG TCTCGGACTC GCCAGCTCGG AAACCACGGA AACCGCCGGC 
AGCGAGACGA GCCCGGACCG GCGCACCGTG ATCGCAGCCG GAGCGCTGTT CGCACTCGAC 
GCCGAGCTCG ACGAGGTCAC CCGCCGGATG CAGCAGTTCG CCGCATCCAA CGTCGATGAC 
GACGCGCTAC ACCAGCTCGA CACCAGCATC GAAGTCGTGG GCCGCCGCTA CGAGAACAGC 
GACGCCGCCA CCGTCTACCC CGTCGCCCTG AAGCAGCGCC GGTGGGTCGC CGACCTGATG 
TCCGGACACC AGCACCCCGA CCAGCGCCGC GAGCTGTACG CCATCGGCGG GAAGCTCTCC 
GGCCTGCTCG GTTATCTCGC GTTCGACCTC GGCAACGAAC TCGTTGCCCG CGCCTACTGC 
AACGAGGCGA TGAGCCTCGC CAAGACCGCC GGACACCGCG ATCTCGCCGC GTGGGTCCGC 
GGCACCCAGA GCTTCATCGC CTACTACGGC GGCCGGTACC GCGAAGCCCT GGACCTTGCC 
CGCGACGGCC AGCGCTACGC CCGCGGCGGC CCCGCCAGCA TCCGACTCGC CATCAGCGGC 
GAAGCCCGCA CCCTGGGCAA GCTCGGCGAC ATCGCCGGAG TCGACGAGGC CGTCGGCCGC 
GCCCTGGCCG CCCACGCCCG CATCGAGGAC ACCGACCCCG TCGGCTACTT CCTGTCCTTC 
GACCCGTTCA CCGCATCCCG CATCGCCGGC AACGCCGCCT CCGCCTACCT CGCCGCCGGA 
GCCCCCGACC GGGCCCGCGA GTTCACAGAC CAGGCCATCC CCATCTTCGC CGCCGCCGAC 
TCCACCGCCA GCCACGCCCT CACCCTGGTC GACGCAAGCA TGACCTACCT AACCGGTCCC 
AACCCCCAGC CCGACCGCGC CGGAGCACTC GTTGCCGAAG CACTCGACGT CGGCGCCGAT 
CTGCGATCCG AAGTGGTCGC CCGCCGGGCC CGGGACTTCC TGCTCACCGC CGCCCAGTGG 
CGCACCGTCC CGGAGATCGC CCAGGTCAAC GACGCCGTCA AAGCCTGGAG ACTGCCCACC 
GCCTGA

Protein sequence

MTRRRPLPTA PTGLWDRPEM AQALTARDMQ TVLAIYRKWT GASQSQIAAM TGIPQPSISV 
IVRGKRQVTT IENFEKFADG LGIPRDRLGL ASSETTETAG SETSPDRRTV IAAGALFALD 
AELDEVTRRM QQFAASNVDD DALHQLDTSI EVVGRRYENS DAATVYPVAL KQRRWVADLM 
SGHQHPDQRR ELYAIGGKLS GLLGYLAFDL GNELVARAYC NEAMSLAKTA GHRDLAAWVR 
GTQSFIAYYG GRYREALDLA RDGQRYARGG PASIRLAISG EARTLGKLGD IAGVDEAVGR 
ALAAHARIED TDPVGYFLSF DPFTASRIAG NAASAYLAAG APDRAREFTD QAIPIFAAAD 
STASHALTLV DASMTYLTGP NPQPDRAGAL VAEALDVGAD LRSEVVARRA RDFLLTAAQW 
RTVPEIAQVN DAVKAWRLPT A