Gene Aazo_0419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0419
Symbol
ID	9338204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	428252
End bp	430144
Gene Length	1893 bp
Protein Length	630 aa
Translation table	11
GC content	44%
IMG OID
Product	transketolase central region
Protein accession	YP_003720094
Protein GI	298489917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.218492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCC AAGAGCAACT ATATCAATGG CAAGAACTAG CTCAACAGTT GCGTGTGGAT 
AGTATTCGCG CTACAACGAT CGCAGGTTCA GGTCATCCTA CTTCTTCTAT GTCTTCCGCT 
GATTTGATGG CGGTTTTTCT ATCTAAATAT CTTCGCTACG ATTTTGATCA TCCAGAAAAT 
CCGAATAGCG ATCGCTTTAT TCTTTCCAAA GGACACGCTG CACCTCTACT ATATTCCATG 
TATAAAGCTG CGGGGGTCAT TTCTGACCAA GAATTACTAT CATTGCGTCA GTCTGGTAGC 
CGTTTAGAAG GTCATCCCAC ACCAATTTTA CCTTGGGTGG ATGTGGCAAC AGGTTCTCTC 
GGACAAGGTT TACCCATTGG TGTGGGGGTG GCTTTGGCAG GTAAATATTT AGACCAATTA 
CCTTATAATG TTTGGGTATT ATTGGGGGAT GGTGAAACGG CTGAAGGTTC GATTTGGGAA 
GCTTTTGATC ATGCTTCTCA CTACACATTA GATAATCTGC TCGCCATTAT TGATGTCAAC 
CGGCTTGGTC AACGTGGTCA AACTGAATTA GGCTGGAATA CACAAGCTTA TGGCAATCGT 
GCTAAGGCTT TTGGTTGGCA AGCAATAGAA ATTGATGGTC ATAATTTAAC AGAAATTGAC 
CAAGCTTTTA GTGCAGCCGT GGCTATAAAT GACCGTCCCA CGGTGATTAT TGCTAGGACA 
AAGAAAGGTA AAGGTGTGAA GGCTTTAGAA GATTTAGGTG GTTGGCATGG TAAAGCACTG 
AAACAGGATC AAGAACAACA AGCTATTACG GAACTAGGTG GAGAACGTCA CATTACCATT 
ACCGTTGATA AACCAGAAGA ACAAAGCCAA CCCGCTACAC TGGGAGTACC TCAACCCCTA 
CAACTTCCCA TATATCAAAA AGGCAATAAA GTAGCCACCC GTCGCGCTTA TGGAGATGCT 
TTATTAGCTT TAGGCGCATC GCAACCTGAT GTGGTTGCTC TTGATGCGGA GGTGAGTAAT 
TCCACTTATG CGGAAGATTT CGCCGAAGCT TTTCCAGAAC GCTACTTTGA GATGTACATT 
GCTGAACAGC AAATGATAGC AGCCGCAGTA GGCTTGCAGG TCCGAAAATA CAAACCCTTT 
GCTTCTACTT TTGCAGCTTT TTTAACTCGT GGTTACGACT TTATTAGGAT GGGTGCGGTA 
TCTCGTGCCA ACATTAAGTT AGTTGGTTCT CATGGGGGTG TCTCCATTGG TCAAGATGGT 
GCTTCCCAAA TGGGATTAGA AGATTTAGCA GCTTTTCGCG CTGTGTGTAA TAGCACTGTA 
TTGTATCCCA GTGATGCTAA TCAGACTGCT AAACTAGTAC CACAGATGAG TAATGCCCCT 
GGTATAGTTT ACCTCCGCAC CACCAGAGAA AGCACACCTG TAATTTATGG TAGTGAAGAA 
CAATTTTCCA TTGGTGGCAG CAAAGTTATC CACCGGTCCG AGCGCGACCA AGCCACAATT 
ATTGCCGCAG GTATCACTGT ACATGAAGCC CTCAAAGCTT ATGACAGATT GAAAAATGAA 
GGGATCACAG CCCGTATTAT TGATGCCTAT TCCGTTAAAC CCATTGATGT GCAAACACTA 
CATCAAGCAG CAAAAGATAC CAACGGTAAT TTAGTAGTTG TAGAAGATCA TTGGCCAGAA 
GGAGGATTAG GTGCGGCTGT CTTAGATGCC TTTGCTGGTA ATAGTACCAC CCCTGCCTAC 
AAAATTCCGC AATTACAGAT TATTAAACTT GCAGTTCAAA ATATGCCAAC TTCTGGAACT 
CCTGAAGAAC TACTCCATGC TGCTAAAATT GATGCAGATG CCATTGTAGA AGTTGTGAAA 
TCACAAGTTA GGCGACTGGT AGGAGTATCT TAG

Protein sequence

MTTQEQLYQW QELAQQLRVD SIRATTIAGS GHPTSSMSSA DLMAVFLSKY LRYDFDHPEN 
PNSDRFILSK GHAAPLLYSM YKAAGVISDQ ELLSLRQSGS RLEGHPTPIL PWVDVATGSL 
GQGLPIGVGV ALAGKYLDQL PYNVWVLLGD GETAEGSIWE AFDHASHYTL DNLLAIIDVN 
RLGQRGQTEL GWNTQAYGNR AKAFGWQAIE IDGHNLTEID QAFSAAVAIN DRPTVIIART 
KKGKGVKALE DLGGWHGKAL KQDQEQQAIT ELGGERHITI TVDKPEEQSQ PATLGVPQPL 
QLPIYQKGNK VATRRAYGDA LLALGASQPD VVALDAEVSN STYAEDFAEA FPERYFEMYI 
AEQQMIAAAV GLQVRKYKPF ASTFAAFLTR GYDFIRMGAV SRANIKLVGS HGGVSIGQDG 
ASQMGLEDLA AFRAVCNSTV LYPSDANQTA KLVPQMSNAP GIVYLRTTRE STPVIYGSEE 
QFSIGGSKVI HRSERDQATI IAAGITVHEA LKAYDRLKNE GITARIIDAY SVKPIDVQTL 
HQAAKDTNGN LVVVEDHWPE GGLGAAVLDA FAGNSTTPAY KIPQLQIIKL AVQNMPTSGT 
PEELLHAAKI DADAIVEVVK SQVRRLVGVS