Gene Noc_0787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0787
Symbol
ID	3707053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	860826
End bp	862664
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	55%
IMG OID	637737289
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_342830
Protein GI	77164305
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATCTT GTATACCACA CCAAAGAGAG CGCGCTGTTT CACCCACCCC AGCCCTCTCT 
CTGTTTTTTT TACTAACAGC GATCCTATCC CTATCCATTT CCCCGGCCCA AGCCAATCTC 
GCTGCAAAGT CCTGGGCGCC TGGTCGTCTT CTAGTACAGC CTAAAGCCGG ATTATCAGAT 
GTGGAATTTC ATAAAGTGCT CGCCCGCACC GGAGCCACTC CCGCCGGTCG CATCGGCCCA 
CTCAATGTCC GTATCGTAAG GGTGCCCGAA CAAGCCGAAG AAGCCGTGGC TCGAGCTCTG 
GCGCGCAATC CCCACATCAA GTTCGCTGAA AAGGATTGGG CCGTGGAGCT GAGCGAAATA 
ACCCCCAATG ATCCGAAATA TGCAAGCGCC TGGCATCTGC CAAAAATCGA AGCTCCTTTC 
GCCTGGAATA CTTCACTGGG CGATAACATC ACGGTGGCTA TTTTGGACAC GGGTATAGAT 
GATACGCACC CAGACCTATC TGGAAAAGTC ATCCCTGGTT GGAATACCGT CAGCAATGAC 
AGTAATACTT CCGATATCCA CGGCCATGGC ACCAAGGTGG CCGGCACCGC CGCAGCCAGC 
AGCAACAATA GTCAAGGAGT GGCCTCTATC GCTTGGAATG CCCTTCTTAT GCCCCTTCGC 
GTAACCAATT CCAGCGATGG CTGGGCCTAC TGGAGCGATA TTGCCGAAGC CTTGACCTGG 
GCGGCCAATC AAGGCGCTCA TGTCGCCAAC ATCAGTTATG ATGTTACCAA TAGCTCAACC 
ATCTCTAATG CCGCCCAATA TTTTCGAAGC TTAGGGGGAA TCGTAGTAGT CGCCGCTGGC 
AACAATGGCA GCAATCCCGG TTACAGCAAT AACCCCTATA TGATTTCGGT TTCTGCGACC 
ACCAGTAGCG ATGGCAAAGC CAGCTGGTCC AACTATGGTA ATTATGTGGA TGTTGCCGCC 
CCCGGTGCTG GGATCTGGAC CACCAGCCGG GGCGGCGGCT ATGGCTCAGT CTCAGGTACA 
TCCTTTGCCA GCCCCGCTAC CGCTGGGGTC GTTGCGCTAA TTCTGGCAGC CAACCCGCTC 
CTGTCGCCGG GAGAAGTGGA ATCCATTTTG ACGAGCACAG CCGATGACCT CGGCGCCGCC 
GGCTGGGACA GTTTCTACGG CCATGGCCGT ATTAATGCGT ACCGTGCCGT GGCAGCCGCT 
AGCGAGGCAG ACACTACGGA CACCCAAGCG CCCACAGTAG CCATCCTCTC TCCCAATGGG 
GGGGCCACGC TATCCGGTAC CATTGCCATT GACGTTAGCG CCCAGGATAA TGGGGATGTG 
GCCCGAGTCG CGCTATATGC CAACGACCAA TTCATTGCTG ATGATACCAC TTCGCTCTAT 
GGTTTTAGCT GGGACTCCAC GTTAGCAGCT GATGGTTCGG TCTCTCTTGT GGCTTATGCC 
TATGATAGGG CAGGCAACGA AGGTATCTCC TCCCCGGTAA ATGTGTTGGT AGATAACAGC 
CCTGACCCCA TCGACACCAC CCCCCCCAGC ATAACCATTA CGGAGCCTGC GGATAACAGC 
GCCGTCAGCG GTACGGCCCA TATCCAAGTC AGCGCCCACG ATAACATGGC ACTTGCCGCT 
ATTCGCCTCT CTATCAATGG CGTGCTCAAG AGTGTAACCG ACACCAGCCC CCTCTCCTAC 
AGCTGGAATA CTCGTAAGGA AGCTCAAGGC TTCCACAACA TTAGTGTGGC TGCCGAGGAC 
AGTGCGGGCA ATACCAGCAC GACCTTTATT ACGGTTAAAG TGAGTTCGGG TAATAAAAGC 
ACCGGGGGTA GGAAAGGAAA AGAGAGTAAA AACAAATAA

Protein sequence

MPSCIPHQRE RAVSPTPALS LFFLLTAILS LSISPAQANL AAKSWAPGRL LVQPKAGLSD 
VEFHKVLART GATPAGRIGP LNVRIVRVPE QAEEAVARAL ARNPHIKFAE KDWAVELSEI 
TPNDPKYASA WHLPKIEAPF AWNTSLGDNI TVAILDTGID DTHPDLSGKV IPGWNTVSND 
SNTSDIHGHG TKVAGTAAAS SNNSQGVASI AWNALLMPLR VTNSSDGWAY WSDIAEALTW 
AANQGAHVAN ISYDVTNSST ISNAAQYFRS LGGIVVVAAG NNGSNPGYSN NPYMISVSAT 
TSSDGKASWS NYGNYVDVAA PGAGIWTTSR GGGYGSVSGT SFASPATAGV VALILAANPL 
LSPGEVESIL TSTADDLGAA GWDSFYGHGR INAYRAVAAA SEADTTDTQA PTVAILSPNG 
GATLSGTIAI DVSAQDNGDV ARVALYANDQ FIADDTTSLY GFSWDSTLAA DGSVSLVAYA 
YDRAGNEGIS SPVNVLVDNS PDPIDTTPPS ITITEPADNS AVSGTAHIQV SAHDNMALAA 
IRLSINGVLK SVTDTSPLSY SWNTRKEAQG FHNISVAAED SAGNTSTTFI TVKVSSGNKS 
TGGRKGKESK NK