Gene Aazo_5179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5179
Symbol
ID	9342986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	5303751
End bp	5304845
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	42%
IMG OID
Product	3-dehydroquinate synthase
Protein accession	YP_003723351
Protein GI	298493174
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.981519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCTG TAATTAAAGT AGATATACCA GGAAAATCTT ATGAAATTGT GATTGCACCT 
GGGAGTTTGG ATAACCTAGG TAAACAGATG GCGAGTTTGA AACTGGGTAA GAAGGTATTG 
CTGGTTTCCA ACCCGATGAT ATTTAAACAT TATGGCGAAA GAGCAATCGC ATCTTTACAA 
AATGCCGGCT TTGAGGTCAC AAGCTATAAC CTGCCACCAG GGGAACGCTA CAAAACCCTA 
AACTCCATCC AAAAAATCTA TGATATTGCC CTCGACAACC GCCTAGAACG TTCCTCCACA 
ATGGTGGCTT TGGGGGGTGG TGTAGTTGGC GATATGACTG GGTTTGCAGC TGCTACATGG 
TTGAGAGGAA TTAACGTTGT CCAAATTCCT ACCAGCCTCT TAGCAATGGT AGATTCGGCT 
ATTGGTGGTA AAACTGGGGT AAATCATCCG CACGGTAAAA ACTTAGTTGG CGCTTTCCAT 
CAACCTAGCT TTGTCTTGAT TGATCCAGAA GTCTTAAAAA CCCTGCCAGC GCGTGAATTT 
CGGGCGGGAA TGGCGGAGGT AATCAAGTAT GGCGTAATTT GGGACGCTGA ATTATTTACC 
CAATTGGAAG CGAGTAAACA CCTTGACCAA CTCCGCTATG TAAAATCCGA CCTGATAAAT 
TACATATTAA CTCATTCTTG TCAAGCAAAA GCAGATTGTA TCAGCAAAGA TGAAAAAGAA 
TCTGGACTCC GTGCAATTTT GAATTATGGT CACACTATCG GTCATGCGGT GGAAAGCTTG 
ACAAATTATC GTCTGTTCAA ACACGGTGAA GCTGTGGGTA CTGGCATGAT AGCAGCAGGA 
GAAATTGCTG TGAAATTAGG ACTTTGGCAA AAAGCCAACA CAGAACGTCA AAACGCGCTG 
ATTAAAAAAT CTGGTTTACC GACACAATTA CCAGCAGGTT TGGATATTCA AGCCATTATT 
GATGCTTTGC AATTAGATAA AAAAGTCAAA TCAGGTAAAG TGCGGTTTGT GTTACCCACC 
CAAATAGGTG AAGTGAAAGT CACAGACGAA GTACCCACAG ATATTATTAG GCAGGTATTA 
CAGGAAATCC AATAA

Protein sequence

MSSVIKVDIP GKSYEIVIAP GSLDNLGKQM ASLKLGKKVL LVSNPMIFKH YGERAIASLQ 
NAGFEVTSYN LPPGERYKTL NSIQKIYDIA LDNRLERSST MVALGGGVVG DMTGFAAATW 
LRGINVVQIP TSLLAMVDSA IGGKTGVNHP HGKNLVGAFH QPSFVLIDPE VLKTLPAREF 
RAGMAEVIKY GVIWDAELFT QLEASKHLDQ LRYVKSDLIN YILTHSCQAK ADCISKDEKE 
SGLRAILNYG HTIGHAVESL TNYRLFKHGE AVGTGMIAAG EIAVKLGLWQ KANTERQNAL 
IKKSGLPTQL PAGLDIQAII DALQLDKKVK SGKVRFVLPT QIGEVKVTDE VPTDIIRQVL 
QEIQ