Gene Francci3_3796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3796
Symbol
ID	3906081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4548847
End bp	4550148
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	70%
IMG OID	637881122
Product	peptidase M16-like
Protein accession	YP_482875
Protein GI	86742475
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0607988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.721107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTCGG CCCTGCCGGC ATCCTCCTAT CCGATCGAGC GGACCCGGCT CGGTAACGGC 
CTGCGCGTGC TGCTCGCCCC CGACCACACC GCGCCGGTGG TGGCCGTCTC GGTGCACTAC 
GACGTCGGGT TTCGATCCGA GCCCGAGGGC CGTACCGGAT TCGCTCACCT GTTCGAGCAC 
CTGATGTTCC AGGGCAGCGA GAACGTCGGT AAGGCCGAGC ATCCGAAGCA CGTCCAGGCC 
GCCGGCGGAA TCTTCAACGG ATCGACGCAC CCGGACTACA CGGACTATTT CGAGCTGCTC 
CCGGCCGGGG CGCTCGAACT GGCCCTGTTC CTGGAGGCGG ACCGGATGCG GGCGCCGAAG 
ATCACCCGCC AGAACCTGGA CAACCAGATC GCCGTGGTGC AGGAGGAGAT CCGGGTCAAC 
GTCCTGAACC GCCCCTACGG GGGATTTCCC TGGATCAAGC TGCCGCCGGT CGCGTTCGAC 
ACCTTTCCGA ACGCCCACAA CGGCTACGGG GATTTCTCCG AGCTCGAGGC CGCGAGCTTG 
GACGACGCCG AGGACTTCTT CGACAAGTAC TACGCACCGG GCAACGCCGT GCTGACCATC 
GTCGGCGACA TCGACCCGGA GGAGACGCTC ACCTTCGTCC ACCGGTACTT CGGTGACATC 
CCCGCCCGCT CGGTGCCGAC GCGGGTGAGT TTCGCCGAGC CGGTGCCGAG TACCGAGCGC 
CGGGCGGTGC TGACCGACCC GCTCGCGCCG CGCGCCGCCC TGGCGGTCGG CTACCGGGTG 
CCCGACCCGA TCGGAGACCT GTCCACCTAC CTGTCCTACT ACCTGCTCAC CGAGATCCTC 
AGCGACGGCG ACGCCAGCCG GCTCGAACGC CGCCTGGTGC AGAAGGATCG CTCGGTCATC 
GGTGTGAGCA CCTACCTTGG CACCTTCGGG GATCCGTTCG AGCAGCGTGA CCCGCTGCTG 
CTGACCCTGG AGGCCCGCCA GTCCGAGGAC GCGAGCGCGG ACGCCGTCCT CGCCGCCGTC 
GACGAGGAAC TGGCGCGGCT GGCGGGCGAG GGCCTGGCGG ACGGCGAGCT GGAGCGGGTG 
CAGGCGCGGG TGGCGTCCTC GCTGCTGCGT GAGTCCGACG ACGCGCTGGG ACGGGCACTC 
GCCATGGCCG TGCATGAGCT GCAACGGGGA CGTCCCGAGT TGGTGAACGA ACTGCCCGCG 
GAACTGTCCG CGGTGACCGG GCAGGCCGTC GCCGCGGCCG CCCGGACGCT TCTCGACCAG 
GGCCGCTCGG TCCTGGAGCT GCGTGCCGGC GCCGCCTCAT GA

Protein sequence

MKSALPASSY PIERTRLGNG LRVLLAPDHT APVVAVSVHY DVGFRSEPEG RTGFAHLFEH 
LMFQGSENVG KAEHPKHVQA AGGIFNGSTH PDYTDYFELL PAGALELALF LEADRMRAPK 
ITRQNLDNQI AVVQEEIRVN VLNRPYGGFP WIKLPPVAFD TFPNAHNGYG DFSELEAASL 
DDAEDFFDKY YAPGNAVLTI VGDIDPEETL TFVHRYFGDI PARSVPTRVS FAEPVPSTER 
RAVLTDPLAP RAALAVGYRV PDPIGDLSTY LSYYLLTEIL SDGDASRLER RLVQKDRSVI 
GVSTYLGTFG DPFEQRDPLL LTLEARQSED ASADAVLAAV DEELARLAGE GLADGELERV 
QARVASSLLR ESDDALGRAL AMAVHELQRG RPELVNELPA ELSAVTGQAV AAAARTLLDQ 
GRSVLELRAG AAS