Gene Aazo_0306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0306
Symbol
ID	9338090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	305321
End bp	306526
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	42%
IMG OID
Product	HtrA2 peptidase
Protein accession	YP_003720013
Protein GI	298489836
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00230132
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTAT CTGTGAAGCA ACTAGTCGTT TACTTGTTTT TAGTAGCTGT TGGTGGAGGT 
GGAGGTGTAT TTGGCAGTCG CTATTTTTTG CCCCAGCATC ACTCATTTCA AGAGTTAGAA 
AATGTCACAG TGGCTTTACC TCCAGAAGCA GTTGTTCCCT ATCCTATTGA TGGAGCAACT 
AACTCTACTA AGAGTGATAA TGTCAACTTT ATTGCTACTG CTGTACAAAA AGTAGGATCG 
GCAGTTGTAC GAATTAATGC TACTCGTAAA GTAGCAAATC CAATTTTTGG CGCATTTGAC 
AACTCTATGT TAAAGCGTTT TTTTGGGGAA GATGAAGAAC CAATTCCTTC GGAACGAATT 
GAGCGTGGTA CAGGATCGGG GTTCATTTTA AGCGCCAATG GTCAGTTACT AACGAATGCT 
CATGTAGTAG ATAATACTGA TACCGTACAA GTTACGCTCA AGGACGGGCG AACTTTTGAT 
GGTAAGGTGG TAGGAATTGA TACTATAACC GACGTCGCAG TGGTCAAAAT TGCCGCTGAT 
AATTTACCGA CGGTGAAATT AGGGAATTCG CAAAACTTAA TTCCTGGACA GTGGGCAATC 
GCTATTGGTA ATCCTTTAGG TTTAGATAAT ACTGTTACTA TTGGTATCAT TAGCGCCACC 
GACCGTACTA GTGCCCAAGT TGGTGTTCCT GATAAGCGGG TAAGTTTTAT CCAAACCGAT 
GCAGCAATAA ACCCTGGTAA CTCTGGCGGC CCTCTCTTAA ACACCCAAGG AGAAGTTATT 
GGCATTAATA CCGCCATCCG CACCGACGCT CAAGGACTTG GTTTTGCTAT TCCCATTGAA 
ACTGCTGCCC GCATAGCTCA TGAGTTATTT ACCAAAGGAA AAGCAGAACA CCCCTTTTCA 
GGAATTGAAA TGGCAGAGCT TTCACCTGCC AAAAAACAAG AATTGAATCA AAAAAAGCAA 
CTCAACATTC AGCTTGATGT CAGTTTTGCC ATTAAAGGAA TTGTGGCAAA TTCCCCAGCA 
CAAAAGGCTG GTTTACTCAT AGGCGATGTG ATTCAAAAAA TCAATGGCAA ACCAATTAAA 
AGTTTAGCCC AAGCACAGAA AATTATTGAG TTTAGTACAG TCGGTGACAT TCTGACAATT 
GAAGTCCACC GCAACGGCAA AACTCAAATC TTCAAAATAC GCTCAGGAAC TTACCCTCAC 
AAATAG

Protein sequence

MKLSVKQLVV YLFLVAVGGG GGVFGSRYFL PQHHSFQELE NVTVALPPEA VVPYPIDGAT 
NSTKSDNVNF IATAVQKVGS AVVRINATRK VANPIFGAFD NSMLKRFFGE DEEPIPSERI 
ERGTGSGFIL SANGQLLTNA HVVDNTDTVQ VTLKDGRTFD GKVVGIDTIT DVAVVKIAAD 
NLPTVKLGNS QNLIPGQWAI AIGNPLGLDN TVTIGIISAT DRTSAQVGVP DKRVSFIQTD 
AAINPGNSGG PLLNTQGEVI GINTAIRTDA QGLGFAIPIE TAARIAHELF TKGKAEHPFS 
GIEMAELSPA KKQELNQKKQ LNIQLDVSFA IKGIVANSPA QKAGLLIGDV IQKINGKPIK 
SLAQAQKIIE FSTVGDILTI EVHRNGKTQI FKIRSGTYPH K