Gene Aazo_0103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0103
Symbol
ID	9337887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	91467
End bp	92615
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	42%
IMG OID
Product	class V aminotransferase
Protein accession	YP_003719875
Protein GI	298489698
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAATA AGCTAATGTT GATGATTCCT GGACCAACCC CAGTTCCAGA AGCTGCCTTA 
TTGGCATTGG CCAAGCACCC AATTGGACAC CGTACTGCTG AATTCAGCAA TATGATGGCG 
GAGGTGACAG AAAACCTCAA ATGGCTGCAC CAAACTGAAA GTGATGTGCT AATGCTGAAT 
GTTAGCGGTA CTGGTGCAGT AGAAGCGGGA ATAATTAATT TTCTTTCTCC AGACGATCAC 
ATTTTAGTCG GTTCTAATGG TAAATTCGGT GAACGCTGGG TAGAAGTTGG TCAAGCGTTT 
GGTTTGAATG TGGAAACTGT CACCGCAGAA TGGGGACAAC CTTTAGACCC AGCTAAGTTT 
GCCGAAAAGT TGCAAGCTGA CACAAACAAG GAAATTAAAG CTGTAATTAT TACTCACAGC 
GAAACTTCAA CAGGTGTAAT TAATGATTTG GTAGCTATCA ACAGCCATGT AAAAGCACAT 
GGTGAAGCCT TAATTATTGT TGATGCTGTC ACCAGCTTGG GTGCATACAA TGTTGCAGTT 
GATGCTTTAG GTTTGGATAT AGTCGCTTCT GGTTCCCAAA AAGGCTACAT GATACCACCC 
GGTTTAGGAT TTGTGTCTGT GAGTCCTAAA GGTTGGGAAG CTTATAAAAC TGCTAAGTTG 
CCAAAATATT ATTTAGATTT AGGTAAATAT CGCAAATCGA CTGCTAAAAA TACAACTCCT 
TTTACTCCCC CAGTTAATTT GATTGTGGCA TTACACACCA CCTTGGGGAT GATGAAGAAA 
GAGGGTTTGG AGTCAATTTT TGCTCGTCAT GAACGTCAAA AGAATGCTAC CCGGGCAGCA 
ATGAAAGCTT TAAACTTACT ATTGTTTGCG GCAGATGAAT GTGCTAGTCC AGCTATTACC 
GCTGTATCAG TACCGGGAAT GGAAGCAGAT AAAATTCGGT CGTTGATGAA AAAGCGGTTC 
GATATTGCTT TAGCTGGTGG TCAAGACCAT TTGAGCAATA AAATTTTCCG TATTGGTCAC 
TTAGGATTTG TGAGCGATCG CGATATTCTT AGCTGTATAG CATCATTGGA AGTCGTACTT 
TCAGAACTGG GCTATGAAAA CTTTACCCCT GGTACTGCTA TAGGCGCAGC GGCAAAGGTT 
TTCGGATAA

Protein sequence

MDNKLMLMIP GPTPVPEAAL LALAKHPIGH RTAEFSNMMA EVTENLKWLH QTESDVLMLN 
VSGTGAVEAG IINFLSPDDH ILVGSNGKFG ERWVEVGQAF GLNVETVTAE WGQPLDPAKF 
AEKLQADTNK EIKAVIITHS ETSTGVINDL VAINSHVKAH GEALIIVDAV TSLGAYNVAV 
DALGLDIVAS GSQKGYMIPP GLGFVSVSPK GWEAYKTAKL PKYYLDLGKY RKSTAKNTTP 
FTPPVNLIVA LHTTLGMMKK EGLESIFARH ERQKNATRAA MKALNLLLFA ADECASPAIT 
AVSVPGMEAD KIRSLMKKRF DIALAGGQDH LSNKIFRIGH LGFVSDRDIL SCIASLEVVL 
SELGYENFTP GTAIGAAAKV FG