Gene Aazo_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1099
Symbol
ID	9338895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1182463
End bp	1183950
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	39%
IMG OID
Product	peptidase S8 and S53 subtilisin kexin sedolisin
Protein accession	YP_003720572
Protein GI	298490395
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0536343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTG ATACTACTAA CAACTTCTCT GCTCAGAAAG AACTCAATAT TGCTGGTATT 
TCCACAATTG ATACATTTCA AACTCAGGCT GACAGTAGTG TAAGTTGGGG TAATCGTAGT 
AGTTTACCAT CACAGGAAAC TAGTGAGTTT GTTGTCACCA CTAGTAGCTA TAACTCCAAC 
AATGGCTATG GCTTAGTCAA TGCAGGATCA GCAGTCAGTA AAGCCGCTGA AGATAGTCCT 
TATACAGATG CTCCTAAACT GGGTAGAAAT AGTTGGGGTG CTGATTTAAT AAATGCTCCC 
ACAGCGTGGG AACATGGATA TACAGGCCAG TCCATTATTG TTGCCGTTTT AGATACTGGA 
ATTGACTACA ACCATAATGA TTTGAATGAT AATATCTGGA CAAATAATAA AGAAATTGCT 
GGTAATGGTA TAGATGATGA TGGCAATGCT TATATTGATG ACTTTCAAGG TTGGAACTTT 
GATAGTAATA CCAATAATGT TTTCGATGAC AATGGTCATG GAACTCATGT TTCTGGAACT 
ATTGCCGGAG AAAATAACAG TGATGGTGTG ACTGGTATTG CCTATAATTG CAAAATTATG 
GCAGTAAAAG TTTTAGATAA AAGTGGTTCA GGTTCTTATG CAAATATCGC TAATGGTATC 
CGTTATGCCG TAGATAATGG CGCAAATGTG ATTAACCTTA GCTTAGGAGG TAATGTTTCT 
AACAACACTC TCAAAATAGC TATTGAATAT GCTGGCAGTA ACGGGGTAAT TGTTGTTATG 
TCCGCAGGTA ACGATGGCGA CTCTACACCA TCCTATCCGG CTCGTTATGC CAATGATTCA 
GGAATTGCTG TTGGGGCAGT AAATCAAAAT AATCAACTGA CTGATTTTTC TAACCGTTCT 
GGTTCTCAAG AAATCAAATA TGTCACTGCT CCAGGTGAGA ATATTTACTC CACACTGCCA 
GGTAATAAAT ATGGTAATTA CACTGGCACT TCTATGGCTG CTCCCCATGT AGCTGGGGTA 
GTGGCGCTGA TGCTTAGTGC TAACCCCAAC CTGTCAGAAA GCCAAGTGCG CGACATGATC 
ACAAGTACAG CTCAAAATGG GACAAACTCT CAAGAACCTA GTCAGCCTTC AAATCCAATG 
CCTTCTATAC CCTCTAACTT TCCACCTCTA GATTCTTTCT TTCCTATCAA TTCGATCAAT 
ATAGGTTCTC AATTTCCTTT TGATATAGGT TCACTATTTC CGCTAGGTTC TCAAACACAA 
TCAGCTACGC AATTACCACC AATTATTTTG TCTGTTGGTG ATAATAGTTT ACAGTTGAAG 
TTTGGTAATG TTAGTACGGG AACTTCCACA ACTGCATACT TCACTTATGA CAGTGAAAAT 
AAACATAGGT GGGCATTGCG TTATTTTGAC ACCACTGGGG TTACATACAC TTTTGTTAAT 
GATGGGGATA TTGAAGCGGA AGATTTGTTT AAGAACTATT ATCCCTAG

Protein sequence

MKFDTTNNFS AQKELNIAGI STIDTFQTQA DSSVSWGNRS SLPSQETSEF VVTTSSYNSN 
NGYGLVNAGS AVSKAAEDSP YTDAPKLGRN SWGADLINAP TAWEHGYTGQ SIIVAVLDTG 
IDYNHNDLND NIWTNNKEIA GNGIDDDGNA YIDDFQGWNF DSNTNNVFDD NGHGTHVSGT 
IAGENNSDGV TGIAYNCKIM AVKVLDKSGS GSYANIANGI RYAVDNGANV INLSLGGNVS 
NNTLKIAIEY AGSNGVIVVM SAGNDGDSTP SYPARYANDS GIAVGAVNQN NQLTDFSNRS 
GSQEIKYVTA PGENIYSTLP GNKYGNYTGT SMAAPHVAGV VALMLSANPN LSESQVRDMI 
TSTAQNGTNS QEPSQPSNPM PSIPSNFPPL DSFFPINSIN IGSQFPFDIG SLFPLGSQTQ 
SATQLPPIIL SVGDNSLQLK FGNVSTGTST TAYFTYDSEN KHRWALRYFD TTGVTYTFVN 
DGDIEAEDLF KNYYP