Gene Aazo_5170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5170
Symbol
ID	9342977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	5294747
End bp	5295970
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	42%
IMG OID
Product	molybdenum cofactor synthesis domain-containing protein
Protein accession	YP_003723345
Protein GI	298493168
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGTCAG TCAGAGATGC AGAAGCTACT ATTTTCAATG CTATACAACC GCTGGATAAC 
CAGCAGGATA TAGAATTTGT CGATTTGTTG ATGGCAAATA ATCGTATTTT AGCCACTCCT 
GTTACCAGTT CCTTCGATTT TCCCCATTGG GATAATTCGG CAATGGATGG TTATGCTGTG 
CGTTATGCAG ATGTGCAGCA AGCAAGGGCT AATAAACCCA TTATTTTGAC AGTTGTGGAA 
GAAATTCCCG CCGGATATCA ACCCCAAGTG ACTATTAAAC CAGGAGAAGC GGCGCGAATT 
TTTACAGGTG CGGTGATGCC AACAGGTGCG GATACTGTTG TTATGCAGGA AAAGACTCAC 
CAGGAAGAAA ACCGCATTTT TATCTTTGCT GCACCTCAAC TAGAAGAGTT TGTTAGACGC 
AAGGGTGATT TTTACCAAGC TGGAAAGCAA CTGTTACCCG CAGGTATTAG TTTAAATGCT 
TCTGAAATTG GGGTTTTAGC TGGGGCAGGA CGTGAGCAAG TCTGTGTTTT CCGTCGTCCC 
CGTGTGGCGA TTCTTTCCAG TGGTAATGAG TTGGTGATGC CGGAAGAAAT GCTCAAACCT 
GGGCAAATTG TTGATTCTAA TCAGTATGCT TTGGCTACTT TGGTAAGGGA ACTGGGTGCG 
GAAGTGTTAC TGTTAGGAAT TGTTAAAGAT GATCCTACGG CTTTAAAAGA AATTATAGAT 
TATGCGATCG CCAACGCTGA TATAGTTATT TCTACTGGTG GTGTATCTGT GGGCGATTAT 
GACTACATAG ATAAGATTTT AGTGTCTCTG GGGGCAAAAG TTCACTTTAG CTCTGTGCAA 
ATGCGTCCGG GAAAACCTCT GACTTTTGCA ACTTTCCCCA ATTCATTATA CTTTGGTTTA 
CCTGGAAATC CTGTTTCTGG TTTGGTTACT TGCTGGCGGT TTGTACAACC AACAATTAAA 
AAACTGGCGG GACTTTCTAA AGGTTGGGAA GGAAAATTTT TGAAAGTGCG ATCGCATTCA 
GAATTACAAT CAAATGGTAA GATGGAAACT TATGTTTGGG GTAAGTTACA TCTGGTAAAT 
GGTGGTTATC AATTTCACAA AGCCGAGGGT AATGATAGTT CGGGTAATTT AATTAATTTA 
GCGCAAACAA ATGCTTTGGC TGTCTTACCT GTGGGTAAAA CTTTGGTTTA TTCTGGTGAG 
GAAGTTTTCG TTTTGCAGCT ATAG

Protein sequence

MLSVRDAEAT IFNAIQPLDN QQDIEFVDLL MANNRILATP VTSSFDFPHW DNSAMDGYAV 
RYADVQQARA NKPIILTVVE EIPAGYQPQV TIKPGEAARI FTGAVMPTGA DTVVMQEKTH 
QEENRIFIFA APQLEEFVRR KGDFYQAGKQ LLPAGISLNA SEIGVLAGAG REQVCVFRRP 
RVAILSSGNE LVMPEEMLKP GQIVDSNQYA LATLVRELGA EVLLLGIVKD DPTALKEIID 
YAIANADIVI STGGVSVGDY DYIDKILVSL GAKVHFSSVQ MRPGKPLTFA TFPNSLYFGL 
PGNPVSGLVT CWRFVQPTIK KLAGLSKGWE GKFLKVRSHS ELQSNGKMET YVWGKLHLVN 
GGYQFHKAEG NDSSGNLINL AQTNALAVLP VGKTLVYSGE EVFVLQL