Gene Francci3_4494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4494
Symbol
ID	3907470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5366291
End bp	5367436
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	71%
IMG OID	637881826
Product	peptidase M50
Protein accession	YP_483569
Protein GI	86743169
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGCGA CCTTCGTGGT GGGACGGATC GCTGGAGTCC GGATCGGGGT CCACTGGAGC 
GTGCTGCTCA TCTTCGGCAT CATCGCGTTC GGCCTCGCGC AGGGCCGCCT CCCACAGGCC 
TACCCGGGCC ATGCCCTGGT GGTGTACTGG GTGGCGGCTC TTGCCGCCGC AGTGGTTTTC 
TTCGCCTCGC TGCTCGCCCA CGAGGTGGCG CACGCCGTGG TGGCCCAGCG CAACGGGGTG 
GCCGTGGACG ACATCGTGTT GTGGCTGCTG GGCGGGGTGG CCCGGCTGAA GTCGGAGGCG 
TCGAGCCCGG CAGCGGAGCT GCGGATCGCT GGTGTCGGCC CACTCGTCAG CCTCTTGCTG 
GGCGGGCTCT TCGTGCTGGG CGCCTGGCTG CTCGCCCTGG CGTCCGCGCC CGAACTCCTG 
ATCGAGGTGG TGGCCTGGCT GGCGGGCATC AACCTGCTGC TCGCCGTCTT CAACGCCTTT 
CCCGCCGCTC CGCTCGACGG TGGGCGGCTG CTGCGCGCCT TCCTGTGGTG GCGTACGGGA 
GATCGGCTGC GGGCGACCGC CGGGGCCACC GCGGCCGGAC GCGTCCTCGG CTGGCTGCTC 
GTCGTTCTGG GACTCCTCGT GTTCATGAGA GGCGGCGGAT TCGGCTGGCT CTGGCTGGCC 
CTGATCGGCT CGTTCCTCAT CGCGGCCGCC ACCGCCGAGG GACGGCAGGC GCAGTTGCGC 
GGTGTGCTCG CCGGCGTCCC GGTACATGAC GCCATGACGA CGAAACCGCT CACGGTGCCC 
GCGGCCCTGA CCGTCGCGGA CCTGCTGGCC GGCCCGCTGT ACCGGTACCG GCACTCGGCG 
TTCCCGGTGA CCGGCGAGAA CGGAGCCCCG GTCGGGCTGG TGACCCTGGA CGGCGCCAAG 
CAGGTGCCGC CGGAGAAGAG CGGCACGGTA ACGGTAAGCG AGGTGATGGT GCCACTGTCG 
CGGACCACCA TCGCGGGTCC CGACGACCCG CTGGCGGATC TGCTGCCGCG CATGGAGCCC 
GGCGCCGAGC ACCGCGTCCT GGTGATGGAT CAAGGCAGAC TCGTCGGGAT CCTGTCCCTG 
TCGGACATCA GCCGCACGGT GACGTGGCTG ATGAACGCCG CCCCCGGGCC GCGCGAAGTC 
CCGTGA

Protein sequence

MRATFVVGRI AGVRIGVHWS VLLIFGIIAF GLAQGRLPQA YPGHALVVYW VAALAAAVVF 
FASLLAHEVA HAVVAQRNGV AVDDIVLWLL GGVARLKSEA SSPAAELRIA GVGPLVSLLL 
GGLFVLGAWL LALASAPELL IEVVAWLAGI NLLLAVFNAF PAAPLDGGRL LRAFLWWRTG 
DRLRATAGAT AAGRVLGWLL VVLGLLVFMR GGGFGWLWLA LIGSFLIAAA TAEGRQAQLR 
GVLAGVPVHD AMTTKPLTVP AALTVADLLA GPLYRYRHSA FPVTGENGAP VGLVTLDGAK 
QVPPEKSGTV TVSEVMVPLS RTTIAGPDDP LADLLPRMEP GAEHRVLVMD QGRLVGILSL 
SDISRTVTWL MNAAPGPREV P