Gene Aazo_0886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0886
Symbol
ID	9338674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	940978
End bp	942192
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	44%
IMG OID
Product	histidyl-tRNA synthetase 2
Protein accession	YP_003720416
Protein GI	298490239
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.151754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGTATC AACCAGCAGC GGGAGCTAGG GATTTACTGC CCTTAGATGT GGCTCAAAAA 
CGCTGGATTG AAGATAGGTT ACAACAAGTT TTTCATCGTT GGGGATATCA CAGGATTATC 
ACCTCAACTT TGGAAAGAAT GGATACTTTA ATGGCTGGTG GAGCAATTCA ACGCCATAAG 
GTAATACAGT TACAAAATGG GCAAGATGAA GAATTGGGCT TGCGTCCAGA ACTCACAGCT 
TCTATTGCCA GGACAGTAGT CACTAGCATG GCAGAGGCTA CTTATCCCCA ACGGTTGTAT 
TACAATGCTA ATGTGTTTCG TCGTAGTAAC TGGGAAAAGC GACATAATCG CCAGCAAGAG 
TATTATCAGG CTGGAGTAGA GTTGCTAGGA TCAGGTGGGT TACTGGCAAA TGCAGAAGTG 
CTGCTGTTGG TAGCCAATTG TTTAGAAGCT TTGGATTTGT GGGGATGGCA TTTAATTTTA 
GGTGAAGCGG GAATTACCAA ATTTCTGCTT GATGCTTTCC CGACTCATGT CAGAAGTAAA 
GTGCGGAGTG CGATCGCTCA CTTAGATCGA GTAGCCTTAG ATACCTTGCC TCTGAGTGAA 
GAACTGCACG AACGTGCCAG AATTATGCTT GATTTGCGTG GTAATAGTGC AGATGTCTTG 
GCAAAAATCA GCAGTTTAAA CTTAGATGCA GATCAACAAG AAGCAGTAAA TAATCTCAAA 
TCTCTCGTCG AGTTACTAGA ATCAGAAGGT AAATTCCCCT TAATTCTTGA CTTGAGTTTG 
ATTCAAACCA TAGACTATTA CACAGGTATA GTGTTTGAAG TAGTTAGTAA TACTGATGGT 
CAGGCACAGG TACTAGGGCG CGGTGGTCGT TATGATCAGC TTCTAGGGTT ATATCATCCT 
CAAGGAGAAA ACATTCCCGG CATAGGCTTT GAGTTGAGCA TTGACGATTT ATACCAACTT 
CTTGCTTCTA CTCAGCAATT ACCGCAAACT ACCCCAGCGA GTAACTGGTT AGTAGTGCCA 
GAAAGCAAAA ATGCTGACGC TGCAGCCTTT GCTTACGCCC AACAACTGCG AGATTCTACC 
AATTTAGTGA GGGTAGAAAT GGACTTAGGG GGAAGAGATG CAGAAGCAAT TCGGAACTAT 
GCAAGTCATC ACTCTATCGC CCAAATCGCC TGGATTAAAG CTGATGGTTC ACCCACAATT 
GAAGCAGTCC ATTAA

Protein sequence

MVYQPAAGAR DLLPLDVAQK RWIEDRLQQV FHRWGYHRII TSTLERMDTL MAGGAIQRHK 
VIQLQNGQDE ELGLRPELTA SIARTVVTSM AEATYPQRLY YNANVFRRSN WEKRHNRQQE 
YYQAGVELLG SGGLLANAEV LLLVANCLEA LDLWGWHLIL GEAGITKFLL DAFPTHVRSK 
VRSAIAHLDR VALDTLPLSE ELHERARIML DLRGNSADVL AKISSLNLDA DQQEAVNNLK 
SLVELLESEG KFPLILDLSL IQTIDYYTGI VFEVVSNTDG QAQVLGRGGR YDQLLGLYHP 
QGENIPGIGF ELSIDDLYQL LASTQQLPQT TPASNWLVVP ESKNADAAAF AYAQQLRDST 
NLVRVEMDLG GRDAEAIRNY ASHHSIAQIA WIKADGSPTI EAVH