Gene Aazo_0647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0647
Symbol
ID	9338433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	677303
End bp	678793
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	35%
IMG OID
Product	Alg9 family protein mannosyltransferase
Protein accession	YP_003720240
Protein GI	298490063
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGCC TGTTTAAACC AGACCACCTA TTATTAGGCA TCCTGATTAT TATTGCATTA 
ATACTGCGTG TTGGCATGGC TTTAAAGTTT CCCAATATAT TTTGGGCAGA TGAAATTTTT 
CAATCCCTAG AACCTGCACA TAGACTAGTT TTCGGTAATG GTATCGTCAC ATGGGAATTT 
AGAGATGGTA TTCGTTCTTG GGTATTACCA GGAATTTTAG CAGGTGTTAT GCACCTTACA 
GCATCGATGG GAGAAGGTTC TACTGGATAT TTAATAGGAG TTAATATCTT TTTGTCTCTA 
CTTTCCCTGA GTAATATCTT AGTTGCTTAT GTTTGGGGAA AAAAAATAGG AGGAACAATT 
ACAGCCCTTA TTTGTGCCGC TATTTGTACT ATATGGTTTG AGTTGATCTA TTTTTCACCC 
AAAGCTTTTA CCGAAGTTGT AGCTACTCAT GTCCTCTTAC CTGGAATTTA CTTAGGAGTG 
CAAAAAGATT CTATCACTAG AAATCGCCTA TTTTTATCAG GATCTTTGTT AGGAATATCT 
TTAGCATTAA GAATTCATCT CATACCAGCT ATAATTTTTG CAGTAGTTTA CATTTGTAAA 
CGAGGTTGGC AGCAAAAATG GTTGCCAATG ATAGCAGGTA TTATAGCTCC CGTATTATTG 
TTTGGTACTG TGGATGCTTT CACTTGGTCT TATCCTTTTC AATCTTTCTG GTTGAATATT 
TGGGTAAATA TTGTTGAAGG TAGAAGTAAA CTATATGGTG TTTCTCCTTG GTATGAATAT 
TTTATTTTTT TGTTCAAAAG TTGGTCGTGG CTATCCATAC CTATTATTAT TCTTACTATT 
ATAGGTTTTC GTCGTATTCC TATTTTGGGA TGGTTAGCCT TAATTATTAT CTTGTCTCAC 
AGTTTCTTGG CTCATAAGGA ATATCGTTTT ATTTATCCAG CATTACCAAT GTTGTTTATA 
TTAGCAGGAA TAGGCACAGG TGAGTTAGTT TTAAGATCTT CTGGTAGATG GTCTTCACTG 
CACATCAGGA TAATAGCAAT ATTACTCTCT ATTTATCTTT GGAGTTCAAC TTCTATTGCT 
CTCTTGAGTA GATTTAATAT TTATGCTCCT TTAAGCTTTT CCACTTTTGG CACGAATTGG 
GAAATGACAC ATCTCTATGC TACTGCTAAT AATCTCGTAG TCTTGCAAAG TTTAAGTACA 
GAAGAAAATG TATGCGGTCT TGGACTTTGG GGTGTTAATT GGGCCTTATC AGGAGGTTAT 
ACTTATTTTC ACCGTGATGT ACCTATATAT CAAGTTGATA CACAAATAGA CTTTGCAGTT 
GCCAATTCAG GTTTTAATTA TGTTGTTGGT AATTCTCCTC TACCATCTAC ATATCCAAAT 
TATTCTTTGC AGCAATGTAG GCTAGGAACT TGTGTTTATA AACGTCCGGG TTCCTGTAGC 
AAAATTAAGG AACGTGAAAT CAATTATGTG CTTAAAATGT CAGGAAATTA G

Protein sequence

MNRLFKPDHL LLGILIIIAL ILRVGMALKF PNIFWADEIF QSLEPAHRLV FGNGIVTWEF 
RDGIRSWVLP GILAGVMHLT ASMGEGSTGY LIGVNIFLSL LSLSNILVAY VWGKKIGGTI 
TALICAAICT IWFELIYFSP KAFTEVVATH VLLPGIYLGV QKDSITRNRL FLSGSLLGIS 
LALRIHLIPA IIFAVVYICK RGWQQKWLPM IAGIIAPVLL FGTVDAFTWS YPFQSFWLNI 
WVNIVEGRSK LYGVSPWYEY FIFLFKSWSW LSIPIIILTI IGFRRIPILG WLALIIILSH 
SFLAHKEYRF IYPALPMLFI LAGIGTGELV LRSSGRWSSL HIRIIAILLS IYLWSSTSIA 
LLSRFNIYAP LSFSTFGTNW EMTHLYATAN NLVVLQSLST EENVCGLGLW GVNWALSGGY 
TYFHRDVPIY QVDTQIDFAV ANSGFNYVVG NSPLPSTYPN YSLQQCRLGT CVYKRPGSCS 
KIKEREINYV LKMSGN