Gene Aazo_1061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1061
Symbol
ID	9338857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1134490
End bp	1135926
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	42%
IMG OID
Product	polysaccharide export protein
Protein accession	YP_003720541
Protein GI	298490364
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0167243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAATA TACATTTGTG GAAAATTTTC AGTCATTCAA CTACAGCTGT AGTTTTATTA 
ACAACAGTTA ATATTGCTTT ATCATCTCTC AGCCTAGCCC AGACACAAAA ACTATCAGCA 
GCGTCAACCA TATCCACAGA TTACTTATTA GGCGGTGGCG ATCGCATTCG CGTCAATGTC 
TTTGAAGTAC CAGAATATAC AGGTGAGTAC CAAGTTCCCC CTGGTGGTGC GATTAATCTG 
CCTTTAATTG GCAGTATATC TGTTCTGGGA TTAACAACAG AACAGGCAGC AGATGAAATA 
GCCAGAAGAT ATGCTCGTTT TCTGAAACGT CCCCTGATTT CCGTGAATTT GTTATCATCT 
CGTCCTATTA ATGTTTTTGT AGCCGGAGAA GTAACAAGAC CAGGATCTTA CACTCTCAGC 
TTACAGGGAA GTGGAGGCGA TAATCCTGGT GTACAATACC CGACCGTATT AGCTGCGCTG 
ACTACAGCCC AAGGGGTAAC ACTAGCAGCA GATGTAAGCA AAGTACAATT ACGCCGTAAA 
ATAGGACGTT CTGGTGAACA AGTTATTAGT TTTAACTTAA AAGAAATCAC CAAAACAGGT 
AAGATACCCC AAGATATTAC CTTACGGGAT GGAGACACAA TCGTTGTACC CACCGCCACG 
AACTTCAACG TTGCTGAAGC CCGAAATTTA TTTGCTGCTA ACTATGCAGC TAGTCAAAAC 
GCACCTCGCA CAGTTGCTAT TACAGGACAA GTTTACCGTC CTGGTTCTTA TCTGGTGACA 
CCAGGTTCTT CTAGTTCGGA AGCAGGTACT GTAGCCCCTG GAAGTGGCTT ACCAACTTTA 
ATGCGGGGAA TTCAACTAGC CGGAGGAATT ACATCACAAG CTGATGTAAG GAGTATTAAA 
ATCCGTCGTC CTACAAGAAT TGGCTCAGAA CAAACTTTAA ATATTAATCT CTGGGAATTG 
TTGCAAACTG GGGATCTCAA TCAAGATGTC GTGTTGCAAG ATGGAGATAC AATTGTAGTC 
CCCACAGCAA CTGAGATTAA CACAGCAGAA GTGACCCAAT TAGCTACCAC TACTTTGTCA 
CCTGCAACTA TTCAAGTTGG GGTAGTAGGA GAAGTGAAAA AACCTGGATT AACAGCTTTA 
CAACCTAATA GCTCTTTAAA TCAGGCTTTG CTGGCTGCTG GAGGTTTCAA TGATGCTAGG 
GCTAGTAGTG CTGCTGTAGA TTTGATTCGT CTCAACCCCA ATGGCACTGT TAGTAAACGG 
GTAGTAAAAA TAGATTTCTC AAAGGGAATT AATGACGAAA CGAATCCTAT ACTTCACAAT 
AATGATGTTG TCCTAGTTAG CCGTTCTGGT ATTGCTAAGA CTAGTGATAC AGTCAATACT 
GTAGCTAGTC CTTTGGGTAC TCTTTTAGGC ATTGTTAGGA TATTTTTTGG ACTCTAG

Protein sequence

MLNIHLWKIF SHSTTAVVLL TTVNIALSSL SLAQTQKLSA ASTISTDYLL GGGDRIRVNV 
FEVPEYTGEY QVPPGGAINL PLIGSISVLG LTTEQAADEI ARRYARFLKR PLISVNLLSS 
RPINVFVAGE VTRPGSYTLS LQGSGGDNPG VQYPTVLAAL TTAQGVTLAA DVSKVQLRRK 
IGRSGEQVIS FNLKEITKTG KIPQDITLRD GDTIVVPTAT NFNVAEARNL FAANYAASQN 
APRTVAITGQ VYRPGSYLVT PGSSSSEAGT VAPGSGLPTL MRGIQLAGGI TSQADVRSIK 
IRRPTRIGSE QTLNINLWEL LQTGDLNQDV VLQDGDTIVV PTATEINTAE VTQLATTTLS 
PATIQVGVVG EVKKPGLTAL QPNSSLNQAL LAAGGFNDAR ASSAAVDLIR LNPNGTVSKR 
VVKIDFSKGI NDETNPILHN NDVVLVSRSG IAKTSDTVNT VASPLGTLLG IVRIFFGL