Gene Francci3_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1990
Symbol
ID	3903698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2338343
End bp	2340586
Gene Length	2244 bp
Protein Length	747 aa
Translation table	11
GC content	70%
IMG OID	637879326
Product	metallophosphoesterase
Protein accession	YP_481093
Protein GI	86740693
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTATT GTCGGAGACT AGACTCAGGC ATGCAGATCA TCGGCGCCGT GCTCACCATC 
CACGGCAACG CGCTCGCAGG GATCGCGGTA AGCGACGGGC GGACCTGGAC ATTCACTCGC 
GACGACGGCT CGTTCAGCCT CCGCACCGTG CCGGGGCGCC CGGTCTGGGC CCGGCGCCCC 
AACGGCTGGA CGGGCCGCTG GTGGCAGCAC CCGGCAGCGG GGGAGCCGGT GCTGTTTCAG 
CTGCACCCAA GCCGCACCGG CAGCGATCCA CAACCACCCT CGGCTCCCTC AGGGGAGCTG 
CGATTCGCGC ACATCACGGA CACGCATGTC AGCGCGATCG ACGGCGACCC GTCCCAGGCG 
GTCGAGCTCG CCGCCCGCTA CGGCGACCAG ACGGACACCA CCAGCGGCCT GCACCACGCG 
CTGCGGACCG CAGCCGACCA CGGCGCGGCA TTCGCCGTGA TCACCGGTGA CCTCACCGAC 
CACGGCACAC CCGAAGAGTT CAGGCGCGTA CTCGACTCCC TCGCCGCAGC GCCGCTGCCG 
GTAGAGATCG TGCCGGGTAA CCACGACCAT TACGGCCACC GCCACCAACC CCACCCCAGC 
GACACCCCCC ACGGTGGCGG GTTTCTCGGC GCGGCTACCC TCACCCGCTA CGAGCAGGCC 
ATGGGCCCGC GCTGGTGGTC AGCTGACCTG GCCGGCGTGC ACCTCCTCGC CCTGGACTGG 
TTCAGCGCCT GGTGCGCGAT CGATGACACC GATCAGCAAC GCTTCATAAT CACCGATCTC 
GCCACCCGAA CCCCCGGGCT GCCAGTCGTC GTGCTCACCC ACGACCAGCC CGACCACGAC 
ACACTCGAAC TGATCCGCTA CAGTGCCGCA CCCGACAGCC TCCTCGCCGT CCTGTCGGGA 
CATTGGCATG CCGACGCGCA GCGCAACGTC GGCGGCTGTC ACCTGCTCAG CACGCCCGCA 
GCCAGCTTCG GCGGACTGGA CTGGTCACCA CCGCAGCTCC GCCTCATCAC CCTCACCCCC 
GGCTTGAGAA CTATGGATCT ACGGCACGAC ACGATCCCGG CGCTACCGAA ACCGCCACGG 
TCACCGACCA CGTCTCGCGC CGATGCCCCG GCCTCGCCCC GCACCACCAG CCACTCGATC 
GGCGCCCATC AACATCTGGG CACCCTCGCG ACCATCGCCG GCACCGTCAT CGCACCGAGC 
ACCGACACCC ACGGCGCAGG ACACCTGACC CGCCTACACC CCTCCAACAC CGGCAGTAAC 
GACAGCCGAG TCGACGTGCT GTGGACGGTG CGCGCCGCAG ACGACCCCAT CACCGGCGTT 
CTCGCCGGCC ATGACCAGAT CCTGGCGTGC AGCCATGCGG GCACCCTCAC CGCGCTCGCC 
CCAGCCACCG GCGCACCCCA TTGGACCCGA CACCTCCCAC ACCGGCAGCG ACGCCGGCTG 
CTAGCCACCC CCATCCTCAC CGCGGCGGGC CGGCTGATCG TCGGTGACGT CGGCGGCGTC 
ACCTGCCTGG ACCTCGACAC CGGGGATATC GCCTGGCACC GCGACCAGCT CGGCCAGGTC 
GACACCCTGC TCACCTACGG AACCGGTCTG GCCACCGACC GCTTGGCCGT GCTGCCCCTC 
GGCGGCCCCA CCCCGGGCCT GACCGCCCTG GACCTGCGCG ACGGCACCAT CACCTGGACC 
GATCCGCCCG GCACACCACC GCCCTCCAGC TCGCTGGTCG CCATTGACGG GACCGATGCG 
CTGCTGCTCC GTACCGCCGG ACCCACCCTC GAGCGGCTGA ACCTCTCCAC CGGCCAGACT 
CGGTGGCGCA CCACCCTGAC CGGCCGCTTC TCCACAGCCG CTCCCCTGGT CACCGACGAG 
GCAATCGTGC TCGTCACCGG CGACGGCATC GCGCACCGGC TCGACCCGGA TCACGGCGGC 
ATCCTCGACC GCCAGCACCT GCACGGGCTG CGCCCCGCCT ACGGTCCCTA CCGGTCCACT 
GGTACCGGCG CGCCCACCAC TGCCGTCCAT ACCCCACTCG GACCGATGAT CGTGCTGCTC 
GATGGCAGTA TCTGGCAACT GGACAGCCCC GCTGGTCCGC TGCTGGTCGG CGACGTCGCG 
GCGCCCGTCA CCACCCAGCC TGTCCTGCTC GGATCGAACA CCCTCGTCGT GCTCAGCACC 
GACGCGGTCG TTCACCTGCT CGACATCAAC GCCACCGCAA CCCGCCCCAT GCTTGCCGGT 
CCGGCATCGC GGTCTGCCTC ATGA

Protein sequence

MIYCRRLDSG MQIIGAVLTI HGNALAGIAV SDGRTWTFTR DDGSFSLRTV PGRPVWARRP 
NGWTGRWWQH PAAGEPVLFQ LHPSRTGSDP QPPSAPSGEL RFAHITDTHV SAIDGDPSQA 
VELAARYGDQ TDTTSGLHHA LRTAADHGAA FAVITGDLTD HGTPEEFRRV LDSLAAAPLP 
VEIVPGNHDH YGHRHQPHPS DTPHGGGFLG AATLTRYEQA MGPRWWSADL AGVHLLALDW 
FSAWCAIDDT DQQRFIITDL ATRTPGLPVV VLTHDQPDHD TLELIRYSAA PDSLLAVLSG 
HWHADAQRNV GGCHLLSTPA ASFGGLDWSP PQLRLITLTP GLRTMDLRHD TIPALPKPPR 
SPTTSRADAP ASPRTTSHSI GAHQHLGTLA TIAGTVIAPS TDTHGAGHLT RLHPSNTGSN 
DSRVDVLWTV RAADDPITGV LAGHDQILAC SHAGTLTALA PATGAPHWTR HLPHRQRRRL 
LATPILTAAG RLIVGDVGGV TCLDLDTGDI AWHRDQLGQV DTLLTYGTGL ATDRLAVLPL 
GGPTPGLTAL DLRDGTITWT DPPGTPPPSS SLVAIDGTDA LLLRTAGPTL ERLNLSTGQT 
RWRTTLTGRF STAAPLVTDE AIVLVTGDGI AHRLDPDHGG ILDRQHLHGL RPAYGPYRST 
GTGAPTTAVH TPLGPMIVLL DGSIWQLDSP AGPLLVGDVA APVTTQPVLL GSNTLVVLST 
DAVVHLLDIN ATATRPMLAG PASRSAS