Gene Franean1_0066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0066
Symbol
ID	5668491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	81495
End bp	82970
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	55%
IMG OID	641238994
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001504439
Protein GI	158311931
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.592117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCTTAG GCGGCAGTAT GGGAGGACTT GGCGTGGTCG ACGTGATGGT GAAGATGCAA 
CCCTCGGACG GGGGCTCGGT TGCCGACTCT CTTGATCAAG CTGATGAGGT CATGAGGTCC 
GCCGACATTA CCCTTGACAG CCACTTTGAG CCCATTCGAA TGCAGGGAAA GAGCCGGGTC 
GGGAGAGATG AAATTCTGCC GTACGGTGGC GACCGATTCA GGCCTTCTTC GAGCGCTGGG 
GAAGATGCGG AACTGCGAAC CGAGAAAGGC GGTCCGGCAT GCGTTATAGT GCGTGCTTCG 
GTAGATACTT GCGATCCTCG GGAGATTGAG GGGTCGCTCA TCGAATTGAA TCGGAGATCT 
GAGGTCATCT CAATCTACTC GGACCCAGAG ATCGCACCAT ATTGGAAATG CTGGAGAGAA 
AATCAGCCCG AAAATTTGTC GGATATGCTT TCGGTGCTGA ACCTGCAAGA ACTTTCCGCT 
GTTGGCATGG ATGGCGATGG TGTTGATGTC GCGGTTGTTG ATGGTGGAAT TGACGCGGAT 
TACCTTGTGC AACGCTCGCG CGATCTCAAG CCCCTAGAGG GCTGGCACCC AGACAACCTA 
CAGAATACCC CAGGTCAATA CGCCGTAAAT AATGATCGCG ATGCGGCGCA TGGAACAATG 
TGTGCCCATG AAGTTCTACT GGCCTCACCC CGGGCGCGAA TTCTAGACTA CGCGCTCCTG 
CGTCGAGCTG CTACGGTGAA CAACAAAGCC ACCATGTCGG GGCTCGACAT TAGGTTCTCC 
CACGCAATAG CTGCGTACCA CGCTCTCGCT AGTCGGCTAA GGAAGGATCG ACGTAGTAAT 
GGAGGAAGCC TCAGCAGGCC ACTGGTTGTT ACGAACTCGT GGGGACTTGG CTCAGTAGCC 
TCAGATGAGG TCACAAACCG CCTCGGCCGG TATCGTGATC AGTTTGAACA CCCCTTCAAC 
CTCGCGGTCG AAGAACTATC ATTGGCCGGA GCCGATATCG TTTTTGCGGC TGGAAACAAC 
GGGCAGCCTC ACCCGGACGA TTCCACTTGG CCACAGGATG AACTTCCCAT TACAGGCGCA 
AATTCACATC CTCTCGCGCT ATGCGTTGGG GCTGTTACGG TAGGTGGCGA ACGGATATGC 
TACTCTTCCC AAGGTCCAGG TAGACTGTTC TGGGGAAAGC CAGATGTCAT GGGTTATTCA 
GAATATGTGG GATCGGAGGT GCTAGGTTCG GATACGCCAG ACGTGGGAAC ATCTGCGGCA 
TGTCCGCTTG TTGCAGGAGT CATCGCGGCA GTTCGTAGCA AAATCGGGAC GGATGTGTTG 
TCTCCCGTGA AGTTGCGAGA GGCAGTGAGG TGTAGCGCCT GGATGCCTTC CGTTGCAGGA 
CACTGCAAGC CGAATAGCGA ATACGGGTGG GGGATCATAG ATCCGAGTGC CCTCCTGGCT 
GGTGTCCGAG AGCATCTAAC TCAATCGCGA GAGTAA

Protein sequence

MPLGGSMGGL GVVDVMVKMQ PSDGGSVADS LDQADEVMRS ADITLDSHFE PIRMQGKSRV 
GRDEILPYGG DRFRPSSSAG EDAELRTEKG GPACVIVRAS VDTCDPREIE GSLIELNRRS 
EVISIYSDPE IAPYWKCWRE NQPENLSDML SVLNLQELSA VGMDGDGVDV AVVDGGIDAD 
YLVQRSRDLK PLEGWHPDNL QNTPGQYAVN NDRDAAHGTM CAHEVLLASP RARILDYALL 
RRAATVNNKA TMSGLDIRFS HAIAAYHALA SRLRKDRRSN GGSLSRPLVV TNSWGLGSVA 
SDEVTNRLGR YRDQFEHPFN LAVEELSLAG ADIVFAAGNN GQPHPDDSTW PQDELPITGA 
NSHPLALCVG AVTVGGERIC YSSQGPGRLF WGKPDVMGYS EYVGSEVLGS DTPDVGTSAA 
CPLVAGVIAA VRSKIGTDVL SPVKLREAVR CSAWMPSVAG HCKPNSEYGW GIIDPSALLA 
GVREHLTQSR E