Gene Aazo_5201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5201
Symbol
ID	9343008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5324089
End bp	5325381
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	29%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003723362
Protein GI	298493185
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.131899
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAC AGGGAATTAA TGTATTAGTA GATGGATATA ACCTAGAAAT GATCCAAGGG 
ACAGGAATAA AAACCTACGG TTTCACCTTA GTTAAGGCTC TGATTGCTCT AGAAGCAAAT 
GTAGATTTAT TATGTAGTCG TTATACTAAT AGTTATAATA GTGATTTACT TTTAAATGAA 
GCTTTATTTT TCGACATACA AAAATCTAAT AGTAGCAATT TAGAAATTAA GAGTATTATT 
AGTGCTGCTA TTCAAGGATT TTATCAAGCC AAAGAAGTGC AAGTTAGTGA TTTTGTCATC 
AAACGAGATG CCGACTATAT TTTTGAGTAT TTAGCTAGTT CAGGAAAAAT ATTCAATATT 
TCTAATTGTT ATAGAACAGC CAATAATTTA TATAAACATT TTCACTTACA AACCAGAGTA 
AACATTAAAA AGAAAATTGA TATCTGGCAT GTTACTTATC CAATTCCTAT TAAAGTAAAT 
GCTGCCAGAA AAATTACAAC TATTCATGAT TTAATTCCGT TAAAACTTCC TTATACTACT 
TTAGATGATA AAAAATGTTT TTTTAATTTA ATCAAGGATG CAATTAAAAA TTCCGAGATT 
ATTCTAACGG TTTCAGAAAG TACAAAAAAT GATATCTTAC ATTGTTTTGA TGTTAATCCA 
GATAAAATTT ATGTGACATA TCAACCAATA ATTGATAATT CACATTTGGT TGAAAACCAT 
ACAACAGAAA CTAAGTTAAA AAAGTATAAA CTTAAAAATA AACAATATAT TCTATTTGTA 
GGAACTATAG AACCTAAAAA AAATATAGGC CGATTAATAG ATGCATATAG TGGTTTAGAT 
ACTGATATGC AGCTAGTTAT TGTTGGCAAA AAAGGATGGT TATGGGAAGA TGAAATCGGT 
AAATTAGAAG CAGTATTTGG TAAAGATTTT AGCAGGGAAA TTAAGTTATT GGAATATGTA 
GAGAAAAAAG ATTTATTATA TCTCTATAAT GGTGCTTTTT GTTTTGTTTT TCCATCTTTG 
TACGAAGGAT TTGGTTTACC ACCTCTAGAG GCTATGTCTT TGGGATGTCC TGTTGTAACC 
TCTAATGTAG CTTCTTTACC AGAAGTTTGT GGAAATGCTG CTCTTTATGT AGATCCTTTC 
GATTCAGATG AAATTAGACT GGGAATTGAG AAGTTGATAA ATAATCCTCA AATACAAAAC 
CAACTTATAG AAGCTGGCAA AGAAAGAGTA AAACTATTTA GTATGGAAAA TTATGCAAAT 
AAACTTTATG AAGCTTATAC AAAAGTAATC TAA

Protein sequence

MDLQGINVLV DGYNLEMIQG TGIKTYGFTL VKALIALEAN VDLLCSRYTN SYNSDLLLNE 
ALFFDIQKSN SSNLEIKSII SAAIQGFYQA KEVQVSDFVI KRDADYIFEY LASSGKIFNI 
SNCYRTANNL YKHFHLQTRV NIKKKIDIWH VTYPIPIKVN AARKITTIHD LIPLKLPYTT 
LDDKKCFFNL IKDAIKNSEI ILTVSESTKN DILHCFDVNP DKIYVTYQPI IDNSHLVENH 
TTETKLKKYK LKNKQYILFV GTIEPKKNIG RLIDAYSGLD TDMQLVIVGK KGWLWEDEIG 
KLEAVFGKDF SREIKLLEYV EKKDLLYLYN GAFCFVFPSL YEGFGLPPLE AMSLGCPVVT 
SNVASLPEVC GNAALYVDPF DSDEIRLGIE KLINNPQIQN QLIEAGKERV KLFSMENYAN 
KLYEAYTKVI