Gene Aazo_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2074
Symbol
ID	9339868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2158041
End bp	2159135
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	43%
IMG OID
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_003721245
Protein GI	298491068
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.71364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC TGATTAATCA ACCAGAAGAC TTTGTAAAGG AAAGTCTAGC AGGAATGGCT 
GTGGCTCATG CTGATTTAAT TCAGGTAAAT TATGAGCCTA GTTTTGTGTA TCGAACTGAT 
GCACCTGTAC AGGGAAAGGT AGCAATCATT TCTGGTGGTG GAAGTGGTCA TGAACCTATG 
CATGTGGGTT TTGTGGGGAT GGGAATGCTT GATGCTGCTT GTCCTGGGGA AGTTTTTACT 
TCACCGACTC CTGACCAAAT GTTAGCCGCA GCACAGCAGG TCGATGGTGG TGCTGGTATT 
CTTTATATCG TTAAAAATTA TAGTGGCGAT TTGATGAATT TTGAAATGGC GACGGAGTTA 
GCCAGAAGTG AAGGTATCCG CACGTTAAAT ATTATTATTG ATGATGATGT AGCGGTGAAA 
GATAGTTTAT ATACGCAAGG AAGAAGAGGT GTAGGAACAA CTGTGCTGGC GGAAAAAATT 
TGTGGAGCCG CTGCGGAACA GGGTTATAAT TTGCAGCAGT TAGCAAATTT GTGTAGAAAG 
GTAAATCTGC ATGGACGCAG TCTAGGTGTG GCGTTGAGTT CTTGTACAGT CCCGGCAAAG 
GGTACGCCGA CTTTTGCTTT GGGGGATAAT GAGATAGAAT TGGGAATTGG TATTCATGGA 
GAACCAGGAA GAGAAAGGGT TTCTATGAAA TCAGGGGATG AGATTACAGA GATTTTAGTG 
CGTTGGCTTT GCCCGTCGCA AGCATCGCTC ATTGATAATA TTGACTATAG TCGCACAGTG 
CGAGAGTGGG ATGAAGCTCA AGAGGGATGG GTTGATGTAG AACTGTTAAA TAAACCCCTG 
CAAAAAGGCG ATCAGATCTT AGCTTATGTT AACAGTATGG GAGGTACTCC CGTTTCTGAA 
TTGTATCTTG TCTACCGCAA ACTAGCAGAA ATCTGTGAAC AGGAAGGACT GCAAATAGTG 
CGAAATCTAA TTGGACCCTA CATGACATCA TTAGAAATGC AAGGTTGCTC CATCACACTG 
CTGAAGTTAG ATGACGAGAT GCTGCGGTTA TGGGATGCAC CAGTAAAAAC AGCAAGTTTA 
CGCTGGGGAG TATGA

Protein sequence

MKKLINQPED FVKESLAGMA VAHADLIQVN YEPSFVYRTD APVQGKVAII SGGGSGHEPM 
HVGFVGMGML DAACPGEVFT SPTPDQMLAA AQQVDGGAGI LYIVKNYSGD LMNFEMATEL 
ARSEGIRTLN IIIDDDVAVK DSLYTQGRRG VGTTVLAEKI CGAAAEQGYN LQQLANLCRK 
VNLHGRSLGV ALSSCTVPAK GTPTFALGDN EIELGIGIHG EPGRERVSMK SGDEITEILV 
RWLCPSQASL IDNIDYSRTV REWDEAQEGW VDVELLNKPL QKGDQILAYV NSMGGTPVSE 
LYLVYRKLAE ICEQEGLQIV RNLIGPYMTS LEMQGCSITL LKLDDEMLRL WDAPVKTASL 
RWGV