Gene Aazo_5000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5000
Symbol
ID	9342807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5118655
End bp	5120511
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	41%
IMG OID
Product	aspartyl-tRNA synthetase
Protein accession	YP_003723240
Protein GI	298493063
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGATA ATGGGAAAGC CTTGACATTT ATTCACCCAT CTAGCCCAGA AAAAAACGAA 
CTAATCACTA TGCGAACTCA CTATTGCGGC GAACTCCGAA AAGAGCATAT TGGAGAAACT 
GTTACCTTGT ACGGTTGGGT AGACCGTCGC CGCGATCATG GGGGCGTGAT ATTCTTAGAT 
TTACGCGATC GCTCAGGCAT TGTTCAAATC GTCAGCGATC CTCAACGCAC CCGAGAATCC 
TACGAAGCAG CCAACGCCAT ACGCAATGAA TACGTTGTAG AAATTACTGG TAGAGTAACC 
CAACGTCCCG CAGAATCCCT GAATCCCCGC ATCCCTACCG GTGAATTAGA AATATACGCC 
GATAAAATTG AACTCCTCAA CGCTGTTCGC AAACAGTTAC CTTTTCAGGT TTCCACCGCA 
GACATAGAAA CAGTGCGGGA AGACTTGCGG TTAAAATATC GTTATTTAGA CTTGCGAAGG 
GAACGCATGG CGCAGAATAT GCAACTGCGT CACCAAGTCG TCAAAGCAAT GCGTCGCTAC 
TTGGAAGATA CCGAAGGTTT CATCGAAATC GAAACACCAG TTCTCACCCG TTCCACCCCA 
GAAGGTGCAC GAGATTATAT CCTTCCCAGT CGCGTTAATG AAGGTGAATG GTTTGCCTTA 
CCTCAATCAC CACAACTATT TAAGCAAATA TTGATGGTAT CGGGCATGGA TAGATACTAT 
CAAATTGCGC GATGTTTCCG CGATGAGGAC TTACGTGCAG ACAGACAACC AGAGTTTACA 
CAATTAGACA TGGAAATGAG TTTCATGTCT GAAAATGAAA TTATTGAACT CAACGAAAAA 
TTAGTTTGTC ACATTTTCAA AACAGTAAGA GAAATTGATT TACCTCATCC TTTTCCTCGT 
CTCACCTATA AAGAAGCGAT GGATAAATAT GGAAGTGATA AACCTGATAC CCGCTACGGT 
TTGCAATTAG TTGATGTTTC CGATGTTTTA AAAGATTCTC GGTTCAAAGT TTTTAACGAT 
GCTATTTCCA AAGGCGGTAT AGTTAAAATT CTTCCCATTC CCAACGGTAA CGATGTAATT 
TCTAATGTTC GCATTAAACC CGGTGGAGAC ATTTTCAGAG AAGCAGCAGA AGCTGGTGCG 
AAGGGTTTAG CTTATATTCG CATTCGGGAA AATGGAGAAA TTGACACTAT TGGGGCAATT 
AAAGATAATT TAACACCAGA ACAAAAAGAG GAAATTATCA CCCGCACAGG TGCAAAAGCA 
GGTCATTTAT TATTGTTTGC AGCTGCTGAT ACTGGTACTG TAAATAAAAC TTTAGATAGA 
ATTCGCCAAT TTGTAGCTAG AGAATTTAAT TTAATTCCAC CAGATAAAAT TAACTTCCTC 
TGGATTACAG AATTTCCAAT GTTTGAATGG AATGCTGAGC AAAAAGGGTT GGAAGCATTA 
CACCACCCAT TTACAGCACC CCATCCTGAT GATTTGCAAG ACTTAAAAAC CGCCCGCGCT 
CAAGCTTATG ATTTGGTATT TAATGGGTTT GAAGTTGGTG GTGGAAGTCT GCGAATTTAT 
AAGCGAGAAA TTCAAGAACA AGTGTTTGAA GCTATTGGTT TATCAACAGA AGAAGCACAA 
AACAAATTTG GATTTTTGTT AGAAGCTTTT GAATATGGTA CACCTCCTCA TGGTGGCATT 
GCTTACGGTG TAGATCGTTT GGTAATGTTG TTAGCAGAGG AAGAATCAAT TCGTGATGTC 
ATTGCTTTCC CGAAGACTCA ACAAGCACGT TGTTTATTAA CAGATGCACC TTCAGCTGTG 
GATACCAAGC AGTTGAAAGA ACTGCACGTT GCTTCGACTT TTAAACCAAA ACTTTAA

Protein sequence

MLDNGKALTF IHPSSPEKNE LITMRTHYCG ELRKEHIGET VTLYGWVDRR RDHGGVIFLD 
LRDRSGIVQI VSDPQRTRES YEAANAIRNE YVVEITGRVT QRPAESLNPR IPTGELEIYA 
DKIELLNAVR KQLPFQVSTA DIETVREDLR LKYRYLDLRR ERMAQNMQLR HQVVKAMRRY 
LEDTEGFIEI ETPVLTRSTP EGARDYILPS RVNEGEWFAL PQSPQLFKQI LMVSGMDRYY 
QIARCFRDED LRADRQPEFT QLDMEMSFMS ENEIIELNEK LVCHIFKTVR EIDLPHPFPR 
LTYKEAMDKY GSDKPDTRYG LQLVDVSDVL KDSRFKVFND AISKGGIVKI LPIPNGNDVI 
SNVRIKPGGD IFREAAEAGA KGLAYIRIRE NGEIDTIGAI KDNLTPEQKE EIITRTGAKA 
GHLLLFAAAD TGTVNKTLDR IRQFVAREFN LIPPDKINFL WITEFPMFEW NAEQKGLEAL 
HHPFTAPHPD DLQDLKTARA QAYDLVFNGF EVGGGSLRIY KREIQEQVFE AIGLSTEEAQ 
NKFGFLLEAF EYGTPPHGGI AYGVDRLVML LAEEESIRDV IAFPKTQQAR CLLTDAPSAV 
DTKQLKELHV ASTFKPKL