Gene Aazo_4085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4085
Symbol
ID	9341890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4150961
End bp	4152808
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	44%
IMG OID
Product	peptidase S8 and S53 subtilisin kexin sedolisin
Protein accession	YP_003722657
Protein GI	298492480
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGAT TTATATTACT GTGCTTGTTT CTTATCGGGT TAGTTACTGT CGTGTTCGGT 
TTCCTGAACG TCCAGGGATT GGCGAGCAAA GGTGAATTTG AGACAATTTT GCTAGATTTT 
CGGGAAGATA TTCCAGCATT GGTGATTAAT CAGGATTTGC AACTGATCGC TCAACAATAT 
CATATTACAC CCCGACTGGA TAACCAATTC TCAGCGGCTG ATCATGTGTA TATTATCAAA 
GGAGATCGCC AAGGGCTGCA AGATTTAAGA AAATCTCCCT TTGCTGAAGC CACAGAGTTC 
ATCGAACCAA ATTACATTTA CAGGAAAGTT CCGGAAGGGA AGACTACAGC ACTGGGAGAA 
CAGTTCCTAC CCCAAAACAA TCAAAATCCT AAACCTTCAT TAATTGGCCC CAACGACCAA 
TATTACAGCA AACAGTGGAA CCTCCACAAA ATTGGCATAG AAGGCGCATG GACTCGCACT 
AAAGGGAGTG GCATAACAGT TGCAGTCATT GACACAGGTA TCACTCAGGT GCGCGACTTA 
GCAGAAACAA AATTTGTTAA AGGCTACGAC TTCGTAAACG ACACAGAAAT AGTCAAAGAC 
GACAACGGAC ATGGCACCCA TGTAGCCGGC ACAGTCGCCC AAACCACTAA TAATCAATAT 
GGTGTAGCTG GAGTCGCCTA CGAAGCTAGT CTCATGCCCT TAAAAGTGTT AAATGCAGAT 
GGTAGTGGTA CAGTTGCCGA CATCGCCGAA GCCATCAAAT TTGCCGCAGA TAAAGGCGCA 
GATGTTATTA ATATGAGCTT AGGTGGTGGT GGTGAAAGTA AACTCATGCA AGATGCCATT 
GAGTACGCCT ACAAAAAAGG TGTAGTTATT ATTGCCGCAG CCGGAAATGA AAGTACAGAT 
GGGGCGAGTT ATCCAGCCCG TTATCCTCAT GTAATTGGCG TTTCTGCCTT TGGCCCAGAC 
GGAGAAAAAG CATCCTACTC TAACTTTGGT GCTGGTGTAG ATATCTCCGC CCCTGGTGGT 
AGTGAAACAG GAACAATTCT CCAGGAGACC ATTGACGAAA ACGGCCAAGG GCTATTTTTG 
GGACTCCAAG GCACAAGTAT GGCCTCTTCA CACGTTGCAG GTGTGGCAGC TTTAATTAAA 
GCATCTGGAG TCACAGAACC TGATCAAATT TTAAAAGTCC TCCAACAGTC AGCCAGAGTT 
ATCCAAGACG ACGCTTTAAA TTATTACGGT GCTGGACAAC TTAACGCCGA AGCAGCAGTC 
AAACTAGCCA GCGAAGGACA AATTAGTTTT CCAGACTTCT TTCGGTGGTT GCGGGATAAC 
GGCTATATCA ACCCTGGTTT TTGGATTGAT GGCGGTGCGA TCGCGCTAGT ACCTAAAATA 
TTAATGGTAG TAGGTTCCTA TCTCCTCGCT TGGTTTCTAC GGGTTTACTT CCCCTTCGCT 
TGGAGTTGGT CTTTATCTAG TGGCTTAATT TTTGGTAGTT CTGGACTCTT CTTCCTGAAG 
GGATTTTATA TCTTTGACCT TCCCCAGTGG CCTTTCCGAG TTTTGGGCAG TTCTCTTCCC 
GAACTAGGTA ACAGCTTACA GGGAACAGGC ACTTTAAATC CTCTTTTTGC CAGTGTGCTA 
ATTCCTGTTG TGTTGATAGT ATTCCTCCTA GGACATCCCA ATTGGAAGTG GTTTGCTGTT 
GGTTCTACCC TTGGCATAGC GGCTTGTTTA ACAATCAGTG CCATTTATGA CCCTGCTGTT 
TGGGGACTAG GAGATGGTAA CATAGCCCGT ATTTTTCTCA TCGTTAATGC TTTACTTTGT 
TATGGATTGG TACGTTTAGC ATTAAAAGAA GACAAACAAA CAGCTTAA

Protein sequence

MRRFILLCLF LIGLVTVVFG FLNVQGLASK GEFETILLDF REDIPALVIN QDLQLIAQQY 
HITPRLDNQF SAADHVYIIK GDRQGLQDLR KSPFAEATEF IEPNYIYRKV PEGKTTALGE 
QFLPQNNQNP KPSLIGPNDQ YYSKQWNLHK IGIEGAWTRT KGSGITVAVI DTGITQVRDL 
AETKFVKGYD FVNDTEIVKD DNGHGTHVAG TVAQTTNNQY GVAGVAYEAS LMPLKVLNAD 
GSGTVADIAE AIKFAADKGA DVINMSLGGG GESKLMQDAI EYAYKKGVVI IAAAGNESTD 
GASYPARYPH VIGVSAFGPD GEKASYSNFG AGVDISAPGG SETGTILQET IDENGQGLFL 
GLQGTSMASS HVAGVAALIK ASGVTEPDQI LKVLQQSARV IQDDALNYYG AGQLNAEAAV 
KLASEGQISF PDFFRWLRDN GYINPGFWID GGAIALVPKI LMVVGSYLLA WFLRVYFPFA 
WSWSLSSGLI FGSSGLFFLK GFYIFDLPQW PFRVLGSSLP ELGNSLQGTG TLNPLFASVL 
IPVVLIVFLL GHPNWKWFAV GSTLGIAACL TISAIYDPAV WGLGDGNIAR IFLIVNALLC 
YGLVRLALKE DKQTA