Gene Aazo_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3044
Symbol
ID	9340847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3131988
End bp	3133796
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	37%
IMG OID
Product	molybdate ABC transporter inner membrane subunit
Protein accession	YP_003721941
Protein GI	298491764
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.929745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACAGG ACTTATCACC CCTTTGGATA TCGCTGAAAA CTTCATTTCT AGCGACTTTC 
ATCACCTTCT TTATGGGTAT TGGTGCTGCT TACTGGATGT TCGGATATAG AGGTAAAGGG 
AAATCTATCA TCGAGGGTAT TTTTATTGCA CCGTTGATTT TACCACCTAC AGTTGTTGGT 
TTTTTGTTGT TGCTATTTTT TGGTAGAAAT GGTCCGGTTG GTAAATTGAT GGAACTATTT 
AACCTCACAA TAGTTTTTAC TTGGTATGGT GCGGCTATAG CTGCAACTGT AGTTTCATTC 
CCGTTAATGT ATAAAACTGC ATTGGGATCT TTTGAACAAA TTGATGCTAA TTTGTTGCGT 
GTGGCGAGGA CTTTAGGTGC TAAGGAACTA ACAATATTTT GGCGGGTTAG TTTACCTTTA 
GCTTTTCCTG GCATTTTAGC AGGTGTAACA TTAGCTTTTG CCCGTGCTTT GGGTGAATTT 
GGAGCAACTT TGATGTTAGC TGGTAACATT CCTGGACAAA CGCAGAATGT ACCGATGGCA 
ATATATTTTG CTGTGGAAGC TGGGGATATC AATGAAGCTT GGTTTTGGGC GGTCTCAATT 
GTGGCAATTT CTCTATCCGG GATTATTTTA ACTAACTTAT GGCAAGAACA AAAACATAAA 
GTTAGAAGCA TAAATAAAGA AATAGATAAA CAAATAGAAC CAGAAAATCA ATCTTTCCTT 
GCATCTTCCA GATCTTCTGC ATCCGGCTTA TTTATAGATA TTGAAAAAAA ACTGGCAAAT 
TTTCATCTCC AAGTAGCTTT TAATACAGAT AGTCAACCAT TAGGATTGTT GGGTGCTTCT 
GGTGCAGGAA AAAGTATGAT TCTCCGTTGC ATTGCGGGGA TAGAAACACC AACACAAGGA 
GTAATTGTAT TAAATAATAA AGTTTTATTT GATTCAAAAA AAGGAATTGA TATTCCTGTT 
CGTAACCGTC GCATTGGATT TTTATTCCAG AATTATGCTT TATTTCCACA TCTAAATGTG 
GCCCAGAATA TCGCCTTTGG TTTACCAAAA AAATTATCTT GTGGAAATCT TAATTTAGAG 
GTAGAAAAAC AATTAATAGC AATGGAACTA CAGGGATTAG GTGATCGCTA TCCTCACCAA 
CTTTCTGGAG GACAACAACA AAGAGTAGCC TTAGCTAGGG CTTTGGCAAG TCAACCGGAA 
GGATTGCTCT TAGATGAGCC ATTTTGCGCC CTTGATACAC ATCTACGCAG TCAGTTAGAA 
CAACAGATGA CAGAGACTTT AACTGATTAT TCCGGTGTGA CTTTATTTGT CACTCATAAC 
ATGGAAGAAG CATATCGGCT TTGTGCCAAT TTATTAGTAT TAGAAAATGG TAAAGAAGCT 
CATCATGGTT CTAAATATGA GATTTTTCAG CACCCTGCTA CTATGAATGT GGCTAAAATA 
ACTGGATGTA AAAACTTTTC TCGCGCTGTT TGTATATCAT CCCAACAGCT AGAAGCCATT 
GATTGGAATT GTACTCTCCA AGTTGTAGAA TCAGTTCCTA ATAAATTATC TCATATCGGG 
ATTCGCGCCC ATCAAATTGT TTTTACCAAT GACCCATATC AGGAAAATAC TTTTCCCTGT 
TGGTTAGCCA GAACCAGTGA AACACCTCAC CGGATTACCT TATTTTTAAA GTTGCATTCT 
CCGGCTCGAA ATGTTCATGA TCATCACTTG CAAGCTGAAG TTTATAAGGA AAAATGGGTA 
AAAATCAAAA ACTTACCTTT TCCTTGGTAT GTACATTTAG AACCTTTGCG GTTGATGTTA 
ATGGAATAG

Protein sequence

MPQDLSPLWI SLKTSFLATF ITFFMGIGAA YWMFGYRGKG KSIIEGIFIA PLILPPTVVG 
FLLLLFFGRN GPVGKLMELF NLTIVFTWYG AAIAATVVSF PLMYKTALGS FEQIDANLLR 
VARTLGAKEL TIFWRVSLPL AFPGILAGVT LAFARALGEF GATLMLAGNI PGQTQNVPMA 
IYFAVEAGDI NEAWFWAVSI VAISLSGIIL TNLWQEQKHK VRSINKEIDK QIEPENQSFL 
ASSRSSASGL FIDIEKKLAN FHLQVAFNTD SQPLGLLGAS GAGKSMILRC IAGIETPTQG 
VIVLNNKVLF DSKKGIDIPV RNRRIGFLFQ NYALFPHLNV AQNIAFGLPK KLSCGNLNLE 
VEKQLIAMEL QGLGDRYPHQ LSGGQQQRVA LARALASQPE GLLLDEPFCA LDTHLRSQLE 
QQMTETLTDY SGVTLFVTHN MEEAYRLCAN LLVLENGKEA HHGSKYEIFQ HPATMNVAKI 
TGCKNFSRAV CISSQQLEAI DWNCTLQVVE SVPNKLSHIG IRAHQIVFTN DPYQENTFPC 
WLARTSETPH RITLFLKLHS PARNVHDHHL QAEVYKEKWV KIKNLPFPWY VHLEPLRLML 
ME