Gene Aazo_1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1540
Symbol
ID	9339332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1612612
End bp	1613748
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	39%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003720854
Protein GI	298490677
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.213513
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAATTA ATAAAGTGCC AAATAATCAT CTATTTGTGT TCTTAGAACT CTTTACAGTT 
GAAGGTGGAA TTCAATCCTA TATTAAGGAT ATTTTTCGTG TCTATCAGGG ATTAAATCAA 
ACTTGTAAAG CCGAAGTTTT CTTGTTGCGA GATAGTCCTG CTTGTATTAA TATTTTCGCA 
TCAGTAAATT TAAAGTTTCA TTATTTTAAA AGCAAATCGT CCAAAATAGG TAGACTCAAA 
TTGGCGATCG CATTAGTTCG ATATCTTCTG CAAAAACGAC CGCAACAAGT TTTCTGTGGT 
CATATTAAGT TAGCAGGACT GATACAAATT TTATGTCAGC CCTTGAGCAT TTCCTATACA 
GTACTCACTT ATGGTAAGGA GGTATGGGAA CCTCTAAATA ATACAGAACG ACGTGCTTTA 
GCTTCAGCTT CAGCAATTTG GACAATTAGC CGTTATAGTC GAGATCGCGC TTGTGCTGCT 
AATGGTATCG ACCCAAAAAA GGTACAAATG CTACCTTGTG CAATAGATGG AGAGAAGTTT 
ACTCCTGGAG AAAAAGCACT GGAATTAATC CAAAAGTATG GTTTAAATAA TGCCAAAGTA 
TTAATGACAG TGGCGCGGTT GTGGTCTGGA GATATTTATA AAGGTGTGGA TGTAACAATT 
AGAGCCTTAC CACAGATTAT CCAGGTGTTT CCAGAGGTAA AATATTTAGT GATTGGCCGT 
GGTAATGACC AACCAAGATT AGCCCAGTTA GCAAAAGATT TAGGTGTGAG CGATCCCCTT 
ATCTTTGCTG GTTTTATACC TACAGAAGCA TTAATGTTAC ACTATCGCCT AGCCGATGCC 
TATATTATGC CCTCCCAAGA AGGGTTTGGT ATAGTTTACC TAGAAGCAAT GGCTTGTGGT 
GTCCCAGTGT TATCTGGTGA TGATGATGGC TCGGCTGACC CATTACAAGA TGGTAAACTA 
GGATGGAGAG TACAACACCG GAATCCTGAT GCAGTGGCAG CAGCTTGTAT TGAAATTCTT 
CAAGGTCAGG ATCAACGTTG TGATGGTAAA TGGTTAAGAG AGCAAACGAT CGCTATTTTT 
GGGATACAAG CTTTTCAACA ACGTTTACAG CAAATGCTCC AATCAACTAA TAACTAA

Protein sequence

MPINKVPNNH LFVFLELFTV EGGIQSYIKD IFRVYQGLNQ TCKAEVFLLR DSPACINIFA 
SVNLKFHYFK SKSSKIGRLK LAIALVRYLL QKRPQQVFCG HIKLAGLIQI LCQPLSISYT 
VLTYGKEVWE PLNNTERRAL ASASAIWTIS RYSRDRACAA NGIDPKKVQM LPCAIDGEKF 
TPGEKALELI QKYGLNNAKV LMTVARLWSG DIYKGVDVTI RALPQIIQVF PEVKYLVIGR 
GNDQPRLAQL AKDLGVSDPL IFAGFIPTEA LMLHYRLADA YIMPSQEGFG IVYLEAMACG 
VPVLSGDDDG SADPLQDGKL GWRVQHRNPD AVAAACIEIL QGQDQRCDGK WLREQTIAIF 
GIQAFQQRLQ QMLQSTNN