Gene Aazo_4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4053
Symbol
ID	9341858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4112734
End bp	4114491
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	43%
IMG OID
Product	cell wall hydrolase/autolysin
Protein accession	YP_003722635
Protein GI	298492458
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.630004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAAG TCTTAGGATT AGTAGTGTTT AACTGTCTGT TTACCTCCTC CGTTGCTTTA 
GCACAAACAT CACTCCTAGT AGTTTTTCCC CCAACAAACT ACCAAACCAG TGCAGAAAAA 
ATATTTTTTA TCGGTACAGC GCCAACGGAT GGACAAGTCC TTATCAATAG TAGACCAATT 
ACCTGCAGTA AAGCTGGTCA TTTTTCTCCC AGTTTCCCCT TACAGTTAGG GGAGAATGTA 
TTTAAGGTAC GTTACCAGAA TCAGGAACTA GAGATTAAGG TAACAAGGTT GTCTACTCAA 
TCAGAATTAC CCCAAGGTTT AGGCTTTGCT AAAGATTCTC TGACTCCTGC TGCTGATATT 
GCTAGACTGC CGGGAGAATT GATTTGTTTT GGTGCTGTTC CACCTCCTCA AGCTACTGTC 
TCTGTCAAGC TGGCTAATCA AACCATTCCC TTGTCACCAC AACCACCACA GGCGCAATTA 
CCTGCTAATT CAAGTGTACT AACGGGAATA AATAAGCCTA GTACTAGTAC TACTAGTCCT 
AAAAAATATC AAGGCTGTAC AACAGTGGCC AATGTTGCTG ATTTGGGACA ACCTCAATTT 
AGTTTGACAT TGAATGGTCA GACCATCACT CAAACTGGTA AGGGCAGAAT TCAAATTCTT 
GATGCTGCAC AGTTAACAGT TGTTGAAGTA ACAGCAACTT CAGGGGTGAC TCGTACAGGA 
GCAAGCACAG ATTATTCTCG ACTCACGCCA CTACCAAAAG GTACAAGGGC AACAGTGACA 
GGTAAAGAGG GTGATTGGTT ACGCTTAGAC TATGGGGCTT GGATCAATAG CAAAGAAACC 
AAAATTATAC CAGATGCACT ACCACCACAG ACGGTAATTA GTAGTGTCGG ATATCGTCAG 
CTTCCAGGTG CGACAGAGAT GATTTTTCCA TTACAAATGG CTGTACCTGT GAGTGTGGAA 
CAGAGCGATC GCACTTTCAC ACTCACCCTT TACAATACCA CTGCCCAAAC AGACACTATT 
CGTTTGGATG ATAACCCCCT AATTTCCCGG CTAGATTGGC AACAGGTCAC TCCACAACAG 
GTTAAATACA CCTTTAACCT CAAAAATCTC CAGCAGTGGG GCTATAACCT GAGATACGAC 
AATACAACTA TGGTGTTAAC TTTACGTCAT GCACCGCATC TTGAACAAAG AAAACGCCTG 
CCTCTATCTG GCATCAAGAT TGTACTTGAT CCGGGACACG GTGGTAAAGA ATCTGGTGCA 
AGTGGTCCAA CGGGGTATTT AGAAAAAGAT GTAAATTTGA TAGTTTCTAA GTTACTGCGA 
GATGAGTTAG TGCAGCGTGG TGCAACAGTA ATGATGACAA GGGAAGATGA TCAGGATGTT 
TCTTTAGTAG AACGTCAGGA GATAATTAGT AAAGAAGAAC CTGCGATCGC ACTTTCTATC 
CATTACAATT CTTTACCTGA TGATGGAGAT GCCGAAAAAA CCAAAGGCTT CGGGGCTTTT 
TGGTATCATC CCCAATCACA TAGCCCAGCA GTGTTTTTAC ATAATTACGT AGTCAAAAAA 
CTCCGAAAAC CTTCCTATGG CGTCTTTTGG AAGAATTTAG CCCTGACTCG TCCCTCTATT 
GCACCTTCCG TACTATTGGA ATTGGGTTTT ATGAGTAATC CCTATGAGTT TGAAGAAGTA 
GTGAACCCAG AGGAACAGAA GAAAATGGCC AAGACTCTGG CTGATGGGGT GACAGAGTGG 
TTTAAAGCGG TCAAGTAA

Protein sequence

MKKVLGLVVF NCLFTSSVAL AQTSLLVVFP PTNYQTSAEK IFFIGTAPTD GQVLINSRPI 
TCSKAGHFSP SFPLQLGENV FKVRYQNQEL EIKVTRLSTQ SELPQGLGFA KDSLTPAADI 
ARLPGELICF GAVPPPQATV SVKLANQTIP LSPQPPQAQL PANSSVLTGI NKPSTSTTSP 
KKYQGCTTVA NVADLGQPQF SLTLNGQTIT QTGKGRIQIL DAAQLTVVEV TATSGVTRTG 
ASTDYSRLTP LPKGTRATVT GKEGDWLRLD YGAWINSKET KIIPDALPPQ TVISSVGYRQ 
LPGATEMIFP LQMAVPVSVE QSDRTFTLTL YNTTAQTDTI RLDDNPLISR LDWQQVTPQQ 
VKYTFNLKNL QQWGYNLRYD NTTMVLTLRH APHLEQRKRL PLSGIKIVLD PGHGGKESGA 
SGPTGYLEKD VNLIVSKLLR DELVQRGATV MMTREDDQDV SLVERQEIIS KEEPAIALSI 
HYNSLPDDGD AEKTKGFGAF WYHPQSHSPA VFLHNYVVKK LRKPSYGVFW KNLALTRPSI 
APSVLLELGF MSNPYEFEEV VNPEEQKKMA KTLADGVTEW FKAVK