Gene Aazo_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1020
Symbol
ID	9338815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1089490
End bp	1090815
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	47%
IMG OID
Product	histidinol dehydrogenase
Protein accession	YP_003720510
Protein GI	298490333
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.473848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCGAA TTATTACTCA GCAGGCAAAC GTTAGAACCG AACTACAACG TATCTGCGAA 
CGTGTACAAC GCGCCGAAGG CGAACGCACC CAGGATGAAC AATTGCTTCA TAAAGAAGCA 
ACCGTGCGGG AAGTGTTGCA GGCAGTTAAA CGCCAAGGCG ATAAAGCTGT ACTGCACTAC 
ATAGCCGAAT TTGACCATCA AACCTTGCAA CCAGAAGAAC TACGGGTGAC TGGTTCAGAA 
CTGGATGCAG CTTACCAACA GGTATCAAAG GATTTGTTAG CAGCTATTCA GCTAGCTTGT 
CGCCAAATTG AAGCGTTTCA CCGTCAGCGA GTACCAAAAA GCTGGGTACA CTTTGGCGAT 
GATGAAGTAG TGCTGGGTAA ACGCTATACA CCTGTAGATC GGGCAGGTTT ATACGTTCCT 
GGAGGTCGCG CTTCCTATCC CAGTACAGTG TTAATGAATG CTATTCCAGC CAAAGTAGCA 
GGTGTACCCA GGATATTGAT GGTGACACCA GCACGAGGAG GGAAAACGAT TAACTCAGCG 
GTTCTAGTAG CTGCACAAGA AGCTGGGATA CAAGAAATTT ACCGCATTGG GGGCGCTCAA 
GCGATCGCAG CTTTAGCTTA CGGTACAGAA ACTATCCCGA AAGTGAACGT GATTACTGGA 
CCAGGTAACA TTTATGTCAC TTTGGCCAAA AAGCTAGTCT ATGGAACAGT GGGTATTGAT 
TCTTTGGCAG GTCCTAGCGA AGTGCTAATT ATTGCCGATC AAACAGCCAA TCCCGTTCAT 
GTAGCCACGG ACTTATTAGC GCAAGCCGAA CATGATCCAA TGGCTGCGGC GATTTTGTTA 
ACCACAGATG CTGGTTTGGC AAAAAAAGTC CAAGTGGCTG TAGATAGACA ACTGGTGGAT 
CACCCACGAC GGATAGATAC AGAAAAAGCG ATCGCCCATT ATGGCTTAAT TGTGGTAGTT 
GAATCCCTAG AAGCAGCAGT AGAACTCTCC AATGAGTTTG CACCTGAACA TCTAGAGTTA 
GAAATTAAAG ATCCTTGGTC TTTAATTTCT CAAATCCGCC ATGCTGGAGC CATTTTCCTG 
GGTTACTCAA CACCAGAAGC GGTGGGAGAC TATTTAGCCG GACCCAACCA CACCTTGCCG 
ACTTCTGGTG CGGCTCGTTA TGCTTCTGGA TTAGGCGTGG AAACTTTCCT CAAACATTCT 
AGTATTATCC AATACTCACC AACTGCACTG AACAAAGTAG CTAATGCTAT TGACTCTTTA 
GCTACATCTG AAGGTTTAAC TTCCCATGCT GATTCAGTCA GAAGGCGAGT TCAGGAGGCA 
GAGTAA

Protein sequence

MLRIITQQAN VRTELQRICE RVQRAEGERT QDEQLLHKEA TVREVLQAVK RQGDKAVLHY 
IAEFDHQTLQ PEELRVTGSE LDAAYQQVSK DLLAAIQLAC RQIEAFHRQR VPKSWVHFGD 
DEVVLGKRYT PVDRAGLYVP GGRASYPSTV LMNAIPAKVA GVPRILMVTP ARGGKTINSA 
VLVAAQEAGI QEIYRIGGAQ AIAALAYGTE TIPKVNVITG PGNIYVTLAK KLVYGTVGID 
SLAGPSEVLI IADQTANPVH VATDLLAQAE HDPMAAAILL TTDAGLAKKV QVAVDRQLVD 
HPRRIDTEKA IAHYGLIVVV ESLEAAVELS NEFAPEHLEL EIKDPWSLIS QIRHAGAIFL 
GYSTPEAVGD YLAGPNHTLP TSGAARYASG LGVETFLKHS SIIQYSPTAL NKVANAIDSL 
ATSEGLTSHA DSVRRRVQEA E