Gene Francci3_4235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4235
Symbol
ID	3907201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	5053309
End bp	5054922
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	73%
IMG OID	637881561
Product	peptidase S15
Protein accession	YP_483310
Protein GI	86742910
COG category	[R] General function prediction only
COG ID	[COG2936] Predicted acyl esterases
TIGRFAM ID	[TIGR00976] putative hydrolase, CocE/NonD family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.59607
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGCCA TCGACGCGAA CCAGGCCGTA CCGGCGGCGG ACGGCGTCCT GCTGGCGACC 
GACGTCTACC GTCCCGACCG GCTACCCGCC CCGGCGGTGG TCACTCGCAC CCCGTACGGT 
CGCGGTTCGC TGCTGGCAAA CGGCGTCGGG TGGGCGCGGA ACGGACTGGC CTACGTTGCC 
CAGGACGTGC GGGGGCGCTA TGGGTCGGGC GGAACCTGGA CCCCGTATCA AGGGGAGCGC 
GCCGATGGCC GGGCGTTGGT CGAATGGGTC CACCGCCAGC CCTGGTGCGA TGGGAACGTG 
ATCCTCGCCG GAGCCTCCTA CGGCTCGTTC ACCGCGTGGG CAGCCGCCGT CACCGTTCCC 
GAGCTCGTGC GCGCAGTGAT CAGCGAGGTA CCCGCCGCGG GTCTGCGGCC CGCCAACGTG 
GACCCGTCGG GGATCCTGCG GCTGGCCGAG TACGCCGGCT GGTGGGCCGA GCACGCCGAG 
AGCCGCACCA GCAGGAACGG GCTGTCCGCG CAGATGCTGG GCTGTGAGCC GGACCTGCTG 
CGGCACCTGC CGGTAGCTGA CCTCGGCCGG CACCTCTGGG CACGGGTGCC ACGCTGGTGG 
AGCGCCATAG CCCCGGCTCT GTCAGCCCCG GCTCTGTCAG CCCCGGCTCC GTTGACGACC 
GGCGACAGCC CGGCACCGCA TGACCGTACT GGCGACGACC TCGGGGAGGG CATCAGCACG 
CAGGAACTGG CCCGCTGCTC GCTGCCGTCC CTGCACATCG GCGGCTGGTA CGATCTCTTC 
CTGCCACAGA CGCTGTGGCA GTGGGAAACC GCGGGCCGCG ACCGCGCTCC GAACAGGCCC 
GCCCGGGGCC TGGTGATCGG GCCGTGGGGG CACGAGCTGT CGACCCCCGC TTCCAGCTCG 
GCGGGTGGGC GGGAGCACGG GCCCGCCTCG CAACTGCCGC TGGGACGCCT CCAGGTCGCG 
TGGATCTTTG ACGTGCTGGC CGGCCGGGAT GCGTCGATCA CCAAGGTGTT CCTCGTCGAG 
GGCGGACGCT GGCTGGATCG GTGGCCGGCG TCCACCGCCA CCCTGGGCCT GCAGGCCAGC 
GCTGACGGGT CACTCCTGCC GAACCCGCCC GAGCGGCCCG CCGAGCACCG GTTCACCTAC 
GACCCGCTCG ACCCCTTCCC CAGCCTCCCG CGGGACTGCG ACCGTGCCCC CCTGGACGCC 
CGCGCCGACG CCGTGGCATT CCGGACCCCG CCACTGACGA CGCCGACTGC CATCGTCGGC 
GCACCCACCG TCACGATGGC CGCAGACACC ACGGGCCCCG GCACCGACTG GATAGTCCGG 
CTGGTGGAGC GGCTCGGTGA CGGCCGGGCC TTGGAGGTCA CCAGCGGCGC CGCTGCCGTC 
GGGCCCGGCG CGGCCACGGT GTCGATCCCG CTCGGCGCCA CGGCCCTGCT GCTCCACCCC 
GGCAGCCGGC TGGAGCTGCA GGTCACCAGC AGCGACTTCC CGCGGCTGGC CCGCACCCCC 
AACACCGGCC AGGACCGGTA CACCACCAGC GCCACCCGGA TCGCCACCCA GACCATCCAC 
ACCGGTCCAA CCCGCGGCTG CCGGGTCGAC CTGCCCGTGC TGGAGCACCC GTGA

Protein sequence

MHAIDANQAV PAADGVLLAT DVYRPDRLPA PAVVTRTPYG RGSLLANGVG WARNGLAYVA 
QDVRGRYGSG GTWTPYQGER ADGRALVEWV HRQPWCDGNV ILAGASYGSF TAWAAAVTVP 
ELVRAVISEV PAAGLRPANV DPSGILRLAE YAGWWAEHAE SRTSRNGLSA QMLGCEPDLL 
RHLPVADLGR HLWARVPRWW SAIAPALSAP ALSAPAPLTT GDSPAPHDRT GDDLGEGIST 
QELARCSLPS LHIGGWYDLF LPQTLWQWET AGRDRAPNRP ARGLVIGPWG HELSTPASSS 
AGGREHGPAS QLPLGRLQVA WIFDVLAGRD ASITKVFLVE GGRWLDRWPA STATLGLQAS 
ADGSLLPNPP ERPAEHRFTY DPLDPFPSLP RDCDRAPLDA RADAVAFRTP PLTTPTAIVG 
APTVTMAADT TGPGTDWIVR LVERLGDGRA LEVTSGAAAV GPGAATVSIP LGATALLLHP 
GSRLELQVTS SDFPRLARTP NTGQDRYTTS ATRIATQTIH TGPTRGCRVD LPVLEHP