Gene Aazo_0470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0470
Symbol
ID	9338255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	484921
End bp	486207
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	44%
IMG OID
Product	major facilitator superfamily protein
Protein accession	YP_003720127
Protein GI	298489950
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.807635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAG TCAAATCTCT ACTGCAAGTT TTCGGTAGCC GGAAGATGGC AGCTTTGATA 
CTACTCGGTT TTTCATCTGG GTTGCCCTTG TTTTTGACTA GCAAGACCTT ACAAGCTTGG 
ATGACAGTTG AAAATGTCGA TTTAACCGCC ATCGGGTTAT TTAGCCTTGT AGGTGTACCA 
TACTCCTTAA AATTTCTCTG GTCGCCTCTG TTAGACTGGT TTACATTGCC ATTTTTAGGA 
AGGCGACGGG GTTGGTTAAT CGCAATTCAA ATTGGGTTAC TAATAGCGCT CGCTTGCATG 
GCACTGCAAC AGCCCAAACA AGCCCTACAA CTGTTAGCCA TAAACGCCGT TGCGATCGCA 
TTCCTCAGCG CCACCCAAGA CATAGCTGCT GATGCTTACC GCACCGACAT TCTTGAACAA 
CTAGAAATGG GCGCAGGTGC AGCAGTATTC GTCTTAGGAT ATCGTATCGC CCTACTACTC 
ACAGGCTCCT TAGCCTTGAT TCTCGCCGAT ATAATTCCCT GGTCTTCCGT ATACTTATTA 
ATGGCAGTCG GCATGGTAGT AGGCATAATT GCCACCGTAT TTGCACCAGA ACCCAAAGAA 
ATCAGTCCAC CAGAATCCTT AAGCGCAGCC GTCATTCTCC CCTTTAGGGA ATTTATTCAA 
CGTCAAGGTG TAGTTCAAGC CATACTAACT CTGTTGTTTA TAGTCCTTTA TAAACTCGGC 
GATTCCTTTG TCAACAATAT GTCCACCTCA TTTTTACTAA AAACAGGCTT CAGCCAAACC 
GACATTGGCG CAATTCAAGG CGGCATGGGA CTGATAGCAA CCATAGTTGG CATACTGGCA 
GGTGGTGCAT TTTTGAGTAA AATTGGACTG AACCGCTCAC TTTGGCTATT TGGTGCCTTG 
CAAGCAGTCA GCAACTTAGC TTACCTTTTA CTTGCACAAG TTGGTAAAAA CTATCAGGTT 
CTCCTACTGA CAATTAACAT AGAAAACTTT TGTGCTGGCT TAGGAACAGC AGCCTTTGTT 
GCCTTTTTAA TGAATATGTG TAATCAGCGT TATTCCGCAA CTCAATATGC TTTACTTTCT 
AGTTTTATGG CCGTAAGTCG TGATATTCTA GTTGCGCCAG CAGGTTCTTT AGCAAAAAGC 
ACAGGTTGGC CTTTATTTTT TGTCATTAGT ATCGTTGCTG CTATACCAGG ACTACTCCTA 
TTACCATTAT TTGCTCCCTG GAACTCAAAA CCATTACCAC TCAAAAGACC AGGAATTGAA 
GAAGAGGATA TATGGGGAAC CAAGTAG

Protein sequence

MNTVKSLLQV FGSRKMAALI LLGFSSGLPL FLTSKTLQAW MTVENVDLTA IGLFSLVGVP 
YSLKFLWSPL LDWFTLPFLG RRRGWLIAIQ IGLLIALACM ALQQPKQALQ LLAINAVAIA 
FLSATQDIAA DAYRTDILEQ LEMGAGAAVF VLGYRIALLL TGSLALILAD IIPWSSVYLL 
MAVGMVVGII ATVFAPEPKE ISPPESLSAA VILPFREFIQ RQGVVQAILT LLFIVLYKLG 
DSFVNNMSTS FLLKTGFSQT DIGAIQGGMG LIATIVGILA GGAFLSKIGL NRSLWLFGAL 
QAVSNLAYLL LAQVGKNYQV LLLTINIENF CAGLGTAAFV AFLMNMCNQR YSATQYALLS 
SFMAVSRDIL VAPAGSLAKS TGWPLFFVIS IVAAIPGLLL LPLFAPWNSK PLPLKRPGIE 
EEDIWGTK