Gene Aazo_3447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3447
Symbol
ID	9341251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3517319
End bp	3518506
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	39%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003722204
Protein GI	298492027
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAT TAGTACTAAG TTGGGAATTT CCTCCCCGGA TAGTCGGAGG TATCGCTCGT 
CACGTAGCGG AATTATACCC GGAACTTGTG AAGCTAGGAC ATGATATCCA CCTGATTACG 
CCTGAAGTTA AACAGGCTTC TCTGTATGAA GTTGTTGAGG GTATTCATGT ATATAGAGTG 
CCAGTTTCCC ATAGTCATGA CTTTTTCCAC TGGGTGGCTA ATTTAAACAA GAGTATGGGA 
CATAACGGTG GTAAGTTGAT TTTGGAAGAA GGCTCTTTTG ATATTATCCA TGCTCATGAT 
TGGTTAGTTG GAGACGCTGC GATCATTCTC AAGCATACTT TTAAAATCCC CTTAATTGCT 
ACTATTCACG CCACAGAATA CGGGCGCTAT AATGGTATTT ACAATGATAC CCAAAGCTAT 
ATTAGTGACA AAGAAAACTT GTTGGCTTAT AACGCTTGGC GAATTATTGT TTGTACTGAA 
TATATGCGTT CAGAAGTAGC AAGAGCATTA CATAGTCCTG GGAATAAAAT AGATGTGATT 
TACAATGGTA TTCGCCCAGA AAAAAAACAG CATCACAAAG ATTTTTATGC TCAAGATTTT 
CGCCGTCAAT TTGCCGCAGA TCATGAAAAA ATAGTTTATT ACCTTGGTCG GATGACCTAT 
GAAAAAGGAG TTTCTGTATT AATTAATGCC GCTACCAAGG TACTTTGGGA AATGGCAGGT 
TACGTTAAAT TTGTAATAGT TGGTGGTGGT AATACTGACC ATTTAAAAAA GCAAGCTTGG 
GAATTAGGAA TTTGGGATAA ATGCTATTTT ACTGGTTTTT TATCTGATGA ATACTTAGAT 
AAATTTCAAA CCATAGCTGA CTGTGCAGTT TTTCCCAGCC TTTATGAACC CTTTGGTATT 
GTGGCTTTAG AAAGCTTTGC TTCTAGAGTA CCTGTTGTAG TTTCCGATAC ATGTGGTTTT 
CCAGAGGTAG TGCAGCATAC AAAAACAGGT ATTGTCACCA AAGTCAATAA TCCGGATTCC 
CTAGCTTGGG GAATTTTGGA AGTTTTACAA AATCCAGGTT ATCGACAATG GTTGGTGGAT 
AACGCATACC AAGACTTAGA AAGACGGTTT AGGTGGAAAA AATTAGCCAA AAGAACGGAA 
GCAGTATATG AGAGAGTGAT AAAAGAGCGC TCGCAAATTC ACTGGTAA

Protein sequence

MKILVLSWEF PPRIVGGIAR HVAELYPELV KLGHDIHLIT PEVKQASLYE VVEGIHVYRV 
PVSHSHDFFH WVANLNKSMG HNGGKLILEE GSFDIIHAHD WLVGDAAIIL KHTFKIPLIA 
TIHATEYGRY NGIYNDTQSY ISDKENLLAY NAWRIIVCTE YMRSEVARAL HSPGNKIDVI 
YNGIRPEKKQ HHKDFYAQDF RRQFAADHEK IVYYLGRMTY EKGVSVLINA ATKVLWEMAG 
YVKFVIVGGG NTDHLKKQAW ELGIWDKCYF TGFLSDEYLD KFQTIADCAV FPSLYEPFGI 
VALESFASRV PVVVSDTCGF PEVVQHTKTG IVTKVNNPDS LAWGILEVLQ NPGYRQWLVD 
NAYQDLERRF RWKKLAKRTE AVYERVIKER SQIHW