Gene Francci3_0069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0069
Symbol
ID	3905404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	86820
End bp	88559
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	70%
IMG OID	637877399
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_479192
Protein GI	86738792
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCGC GTCTCCCCTT CAGCAGTAGC GCCGAGGCCG CCCCCGGGGG CGGCGGCAGG 
GAGGGGTCCG GCGCCGGGCA TGACTCCCCC TCCCCCTGGG CTCCGCCCAT CGGCAGCGCG 
GCCGGGACAC CAGCCGGCCA AGCTCACCCG GCTGGTCCCG CCAGCTCCGA ACCCGACCTC 
CCGGCGGGCC CGCCTTCCCG TCCGCCCGGC TCGCCGTACA GCCAACCGCC GGCGCTGGGG 
CCATCCTCCG GCCAGCATCC TCAGTATCCG AATCCCCATC CCCCGCATGG GGATCCTCGT 
CCGTATCCGG ATTCTCCGTA CCCGGCCGGG CCGTCCCAGG CCAGCCAGCA GCAGGCCGCG 
TTCTCCGCGG GAAGCCCACC TCCGGCGGCG CCGCCCGGCG GCCCGTGGGG ACCACCTTCA 
GGCCCGCCAC CCAGTGGTCC CGCTGCCCCG AGAGCTCTGA ACGGCGCGGC CGGCCCCGCG 
GGCCCCCCCG CGGGACCCCC GACCGGAGGG CATTCCTGGG GACCGCCGTG GAGTTCCCCG 
AGCGGCGCCG GCTCGCCACC CGCCCAGGAC CTCTACGGCA ACGGGACAAC CATGGCCGCC 
TCGCCGCCTT GGCGCCGACG GCGGCTCGTC GCCGCCGGAC TCGCCATTGC CCTGGTCTCA 
GCTGGTGTAG GTGGCGGTGT CGGAGCGCTG GTCGCCGATA ACAACGGGGG GCAGACCATC 
GTCACATCCG CCGGTCTGCA CAACACCGTG GACAGTTCCG GTGGAACGTC GCCGGCAGCC 
GCGAACACCG TGTCGGCCGC GGCGCAGAAG ATCCTGCCGA GTGTCGTGAC AATCTCCGAG 
GAATCGAGCA GCGAGTCGGG CACCGGCTCC GGCACCATCA TCCGTTCGGA CGGGCATATC 
CTGACGAACA ACCATGTGGT CTCGGGTGCC GCGAACGGCG GTTCGCTGAC GGTCACCCTG 
CAGGACGGTC GTACCTTCGA TGCGCAGGTC GTAGGCACGG ATCCGAGCTC GGACCTCGCG 
ATGATCAAAA TCAATGCCAC CGGTCTCACT GCGGCCACGT TCGGCAATTC CGACACGCTG 
AACATCGGGG AACTGGTGGT AGCGGTCGGC AGTCCGCTCG GGCTGAACGG TACGGTCACG 
TCCGGCATCG TCAGTGCCGT GCATCGCCCG GTGCGCACCG GGGATTCAAC CGTGCGGGAT 
CAGCAGAACA CCGTGCTCGA CGCAATCCAG ACCGACGCAT CGATCAACCC CGGTAACTCC 
GGTGGTCCGC TGGTCAACAG TCGCGGCGAG ATCATCGGCG TGAACAGCGC GATCGCGACC 
GTGGGTGGTG GAAGTCCCTT CGGTGGCGGC CAGCAGTCCG GCAACATCGG CGTCGGTTTC 
GCTATTCCGG GCAACTATGC CGAGTCGGTG GCCACCCAGT TGATCTCCAC GGGAAGCGCC 
CGGCACCCGT ACCTGGGCGT CAGCGCCTCC ACCGCGGAGG AGAACACCCG CTCCACCGCC 
TCCAGCGGCA ACGGTGCACA GATCCGCTCC ATGGTTCCGG GTGGACCCGC CGAAAGGGCC 
GGCCTTCGCA CCGGCGACGT CATCACGAAG GTCGGCAACC GTGCCGTCAA CGACGTCGAC 
TCCCTCATCG CGGCGGTCCG GTCCCACGCC ATCGGCGACG AGGTGGAAGT GACCTATACC 
CGTGATGGAC AGAGCGGCAC CGTCAAGGCC CGGCTCGCCC AACAACCACC GGCATCCTGA

Protein sequence

MTPRLPFSSS AEAAPGGGGR EGSGAGHDSP SPWAPPIGSA AGTPAGQAHP AGPASSEPDL 
PAGPPSRPPG SPYSQPPALG PSSGQHPQYP NPHPPHGDPR PYPDSPYPAG PSQASQQQAA 
FSAGSPPPAA PPGGPWGPPS GPPPSGPAAP RALNGAAGPA GPPAGPPTGG HSWGPPWSSP 
SGAGSPPAQD LYGNGTTMAA SPPWRRRRLV AAGLAIALVS AGVGGGVGAL VADNNGGQTI 
VTSAGLHNTV DSSGGTSPAA ANTVSAAAQK ILPSVVTISE ESSSESGTGS GTIIRSDGHI 
LTNNHVVSGA ANGGSLTVTL QDGRTFDAQV VGTDPSSDLA MIKINATGLT AATFGNSDTL 
NIGELVVAVG SPLGLNGTVT SGIVSAVHRP VRTGDSTVRD QQNTVLDAIQ TDASINPGNS 
GGPLVNSRGE IIGVNSAIAT VGGGSPFGGG QQSGNIGVGF AIPGNYAESV ATQLISTGSA 
RHPYLGVSAS TAEENTRSTA SSGNGAQIRS MVPGGPAERA GLRTGDVITK VGNRAVNDVD 
SLIAAVRSHA IGDEVEVTYT RDGQSGTVKA RLAQQPPAS