Gene Francci3_3945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3945
Symbol
ID	3906904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4722728
End bp	4724071
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	75%
IMG OID	637881272
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_483024
Protein GI	86742624
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.542591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCACC GCGCCATGCT CGGCCTGCTG GTCGGCCTCG CGCTGCTGGT CGGCCTCGTG 
ATGACGACCG CTCCGGCCGG CGCCGCCGTC CCGCCGTACG CGGCCGGGCC CGGCCCGGCT 
TCGATCGCGC CCGCCCGAGG CTCGCAGTGG TACCACGCTG TCCTGGGACT CGCCCAGGCG 
CACCGGATCA GCCAGGGCGC GGGCACGGTG GTGGCCGTCA TCGACGGCGG GGTCGACGCC 
AGCCAACCCA AGTTGTGGGG TCAGCTGCTT CCCGGTACCG GCATCGGCCC CGGGGCGGCG 
CGGGACGGTT GGCGCGACGA TGATCCGAAC GGCCACGGCA CCGCCATGGC GGGCATCATC 
GCCGGTCGCA ACGACAACGG CCGGCCCGAG GTCCGCGGCA TCGCCCCGGC CGCCAAGATC 
CTGCCCGTCT CGACCGGCGC CGAGGCGAAC TCGGAGGAGG TCGCGATCGG CATCCGCCGG 
GCAGTCGACC TGGGTGCCGA CGTCATCAAC CTCTCCCTGG GCTCGACGGG GACGGCGACC 
CCGGACGAGG AGAAAGCGGT CGGCTACGCC CTCGCGCACG ACGTGGTGGT GGTCGCCTCG 
GCGGGGAACG TCGAGTCCGG CGACACCGCG ATCAACTCCC CCGCCAGTAT CCCGGGGGTG 
GTCGCGGTGA CCGGATCGAC GGCCGCTGGT GGTTTCTGGC GGGAATCGGC CCACGGGCCG 
CGGGCCGTCA TCGCCGCGCC GGCCCCCGGT ATCCGGGCCC CCGTCCCGAC CCGGGTCTCC 
CCGGACGGCC TGGACACCGG GGGCGGCACC TCGAACTCCG CGGCGATCGT CGCGGGCGTT 
GTCGCCCTCA TCCGGGCCGC CCAGCCGGAC CTGGACGCAC CCAACGTCAT CGAGCGGCTC 
GTCTACACCG CGCGGGATGC GGGCTCTCCT GGCCGCGACG ACGAGTTCGG CTTTGGCATC 
GTCGACCCCG TCGCGGCGCT GACCCGGGCC GTGCCGGTGG TCAGGAGCAA TCCGCTGCTG 
TCGGCACCGA CACGCTGGGG GGTGGGGGGG CCCGCGCCGG CCGCCGGCCG CATCATGCCC 
GGCGGGCAGG CCCGGGGGTC CGCCGGCGAC GCGACGACCC ACGGGGCCGG CGCCACACTC 
ACGAACACCG GTCCGATCGG CGCAGCCGGC CCAGACTCAT CGAAACCCTC GCCACTGGTC 
TGGACCGCCG GGCTCGGGAT CGCGGCCTCG TTGGGCGTCC TGCTCGGGAT CGTGACACAT 
CTGCTGTACG CCTGGCAGCG CGCGACGCGG GCGGGACCGG GCCGCGCGGG CAGCCGCGTC 
CGCCCGCGCT CCCCTACCGG GTGA

Protein sequence

MHHRAMLGLL VGLALLVGLV MTTAPAGAAV PPYAAGPGPA SIAPARGSQW YHAVLGLAQA 
HRISQGAGTV VAVIDGGVDA SQPKLWGQLL PGTGIGPGAA RDGWRDDDPN GHGTAMAGII 
AGRNDNGRPE VRGIAPAAKI LPVSTGAEAN SEEVAIGIRR AVDLGADVIN LSLGSTGTAT 
PDEEKAVGYA LAHDVVVVAS AGNVESGDTA INSPASIPGV VAVTGSTAAG GFWRESAHGP 
RAVIAAPAPG IRAPVPTRVS PDGLDTGGGT SNSAAIVAGV VALIRAAQPD LDAPNVIERL 
VYTARDAGSP GRDDEFGFGI VDPVAALTRA VPVVRSNPLL SAPTRWGVGG PAPAAGRIMP 
GGQARGSAGD ATTHGAGATL TNTGPIGAAG PDSSKPSPLV WTAGLGIAAS LGVLLGIVTH 
LLYAWQRATR AGPGRAGSRV RPRSPTG