Gene Saro_0294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0294
Symbol
ID	3916231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	316744
End bp	318090
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	70%
IMG OID	640443023
Product	microcin-processing peptidase 1
Protein accession	YP_495576
Protein GI	87198319
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGTCAC CCGCCGAAGC CCGTGAGCGC TGCGAAGCGC TGGTCGAACG GGCACGCCGC 
GCCGGTGCAG ATGCAGGCGA TGCCGTCTAC ATCGCCAGTG GCTCCGAATC GGTGCAGGTC 
CGCCTCGGCG CGCTCGAGGA CGTGGAACGC TCCGAATCCG AGCACATCGG CCTGCGCGTC 
TTCGTCGGCG GCGCTTCAGC CTCCATCGGA TCGACCGACC TCGGCGATGC CGCGCTTGAC 
GAACTGGCCA GCCGCGCGGT TGCCATGGCC CGACTGGCCC CCGCCGACAA GTTCGCAGGC 
CTCGCGCCCG AAGACATGCT GTTTCGCGGC CCTGTGCCCG ATCTCGACCT CGACGACGCC 
ACCGAACGCA GCCCCCAGGA CCTGCGCCGC CTGGCCGAGG AAGCGGAAGA TGCGGCGCGC 
GCCATCGCGG GCGTGACCAA CAGCGAGGGC GGAAGCGCCA GCGCGGGGCG CGGCCTTTTC 
GCACTTGCCA CCAGCCACGG CTTTTCCGGC GCCTACGCCG CATCGAGCCA CAGCATTTCC 
GCCAGCGTCG TTGCCGGCGA AGGCAGCGCG ATGCAGCGCG ACTATTCCTG GCGCAGCACG 
CGCCACGCGG CAGACCTGCT GCCCCCGGCC CGGATCGGCG CTGAAGCGGG CGAGCGCGCG 
GTCCGCCGCC TCAACCCCGG TCGGGTGAAG AGCGGCCAGG TGCCCGTCGT GTTCGACCCG 
CGCGTCGCCA ACAGCCTTGT CGGACACCTC CTCGGCGCCA TGTCGGGTGC ATCGATCGCC 
CGCCGCGCCA GCTTCCTTCT GGACCGGGAC GGCGCCCAGC TGTTCGACAG CGCGATCACC 
ATTTCGGACG ACCCCCTGTC CATTCGCGGC ATGCGCTCGC GCCCGTTCGA CGGCGAAGGC 
CTGCCAACCG CGCCGCGCAA GCTGGTGGAC GCGGGCAAGC TGACCGGCTG GCTGATGGAT 
ACCGCCGCTG CCCGGCAACT CGGCAGCCGC CCCACCGGCC ACGCATCGCG CGGGGCGTCC 
GGCGCGCCGC ACGTCACCGC GAGCAACGTG GTCCTCGAAC CCGGCACGGT GACCCCGGCT 
GAACTGATGG CCGACATCGC CGACGGGGTC TATGTGACCG AACTGATCGG CCAGGGCGTG 
AATGCCGTCA CGGGCGACTA CAGCCGCGGC GCATCGGGCT TTCGGATCGT GAACGGCGAA 
ATCGCCGAGG CGATTGCCGA ATTCACCGTG GCAGGCAACC TCATCGACAT GTTCGCCGCG 
CTTACCGCAG CCAACGATCT CGAAGTCTAT CGCGGCATCG ACACGCCGAC CCTGCGCGTG 
GACGGGATGA GCATCGCCGG CGACTGA

Protein sequence

MLSPAEARER CEALVERARR AGADAGDAVY IASGSESVQV RLGALEDVER SESEHIGLRV 
FVGGASASIG STDLGDAALD ELASRAVAMA RLAPADKFAG LAPEDMLFRG PVPDLDLDDA 
TERSPQDLRR LAEEAEDAAR AIAGVTNSEG GSASAGRGLF ALATSHGFSG AYAASSHSIS 
ASVVAGEGSA MQRDYSWRST RHAADLLPPA RIGAEAGERA VRRLNPGRVK SGQVPVVFDP 
RVANSLVGHL LGAMSGASIA RRASFLLDRD GAQLFDSAIT ISDDPLSIRG MRSRPFDGEG 
LPTAPRKLVD AGKLTGWLMD TAAARQLGSR PTGHASRGAS GAPHVTASNV VLEPGTVTPA 
ELMADIADGV YVTELIGQGV NAVTGDYSRG ASGFRIVNGE IAEAIAEFTV AGNLIDMFAA 
LTAANDLEVY RGIDTPTLRV DGMSIAGD