Gene Aazo_2517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2517
Symbol
ID	9340316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2622960
End bp	2624249
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	42%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003721539
Protein GI	298491362
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGATTT TAATTTACTC CTACAATTAT TACCCAGAGC CTATTGGTAT TGCGCCGCTA 
ATGACTGAAT TAGCAGAAGG ACTGGTGAAA CGTGGACATC AAGTACGGGT AGTTACAGCT 
ATGCCCAACT ATCCTGAACG TCAAATTTAT GAGGACTATC GCGGCAAACT GTATTTAACA 
GAATATAAAA ATGGTGTTCA TATCCAACGC AGTTATGTTT GGATTCGCCC CCAACCCAAC 
CTATTAGATC GGGTAATGTT GGATGCTAGT TTTGTAGTCA CCAGTTTTTT ACCTGCAATC 
ATGGGCTGGC GACCTGATGT GATTCTTCTG ACCTCCCCAT CTCTTCCAGT TTGCTTACCA 
GCAGGCCTTT TAGGATGGTT ACGCTCCTGT CCAGTCATCT TAAATTTACA AGATATATTA 
CCTGAAGCAG CTATCCACGT TGGTTTACTG AAAAATCAAT TACTAATCAA GATATTCACA 
GCACTAGAAA AATTTGCCTA CGCCTCGGCC ACTAAAATTA GTGTAATAGC TGATGGGTTT 
GTAGAAAACT TACTTTCCAA AGACGTACCA GCCAACAAAA TTGTGCAAAT TCCTAACTGG 
GTTGATGTCA ATTTTATTAG CCCCTTACCA AAAGAAAATA ACCCCTTTCG CGCTACACAT 
AACCTGAATG GTAAATTCGT AGCTTTGTAT TCTGGCAACA TCGCCTTAAC CCAAGGTCTA 
GAAACAGTAA TTAAAGCAGC CGCCAAATTA AGTCATATCA CAGAAATTGC TTTTGTGATT 
GTTGGTGAAG CCAAAGGCTT AAAAAGACTG CAACAGAAAT GTTTGGACGA AGGAGCAGAC 
AACGTTTTGT TATTACCATT TCAACCTCGT CAAGACTTAC CGCAAATGTT GGCAGCAGCA 
GATGTAGGGC TAGTGATACA AAAGAAAAAC GTGATCTCCT TCAATATGCC ATCAAAGATT 
CAGGTTTTAC TTGCCAGCGG TAGAGCGTTG GTTGGCTCCG TACCTGATAA TGGCACAGCA 
GCCAGAGCAA TTAAACAAAG TGGTGGTGGA ATTATAGTTC CTCCAGAAGA TTGCCAAGCC 
TTAGCAACAG CGATTTTGGA ATTGTACCAA AACCCGGCAC AAGTAAAGAC TCTGGGCTGC 
AATAGCCGTC AATATGCTGT TGAGCAATAC GCCTTTGAAC AAGCCTTAAA TCATTATGAG 
ACATTGTGTT ATTCATTGAC CGCCGATGCT AAAACCATTC AGCCTGCAGT TGTCACAACA 
GCAGCTAATA AAAAGGGTGT AGGGGTGTAG

Protein sequence

MRILIYSYNY YPEPIGIAPL MTELAEGLVK RGHQVRVVTA MPNYPERQIY EDYRGKLYLT 
EYKNGVHIQR SYVWIRPQPN LLDRVMLDAS FVVTSFLPAI MGWRPDVILL TSPSLPVCLP 
AGLLGWLRSC PVILNLQDIL PEAAIHVGLL KNQLLIKIFT ALEKFAYASA TKISVIADGF 
VENLLSKDVP ANKIVQIPNW VDVNFISPLP KENNPFRATH NLNGKFVALY SGNIALTQGL 
ETVIKAAAKL SHITEIAFVI VGEAKGLKRL QQKCLDEGAD NVLLLPFQPR QDLPQMLAAA 
DVGLVIQKKN VISFNMPSKI QVLLASGRAL VGSVPDNGTA ARAIKQSGGG IIVPPEDCQA 
LATAILELYQ NPAQVKTLGC NSRQYAVEQY AFEQALNHYE TLCYSLTADA KTIQPAVVTT 
AANKKGVGV