Gene Aazo_2221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2221
Symbol
ID	9340020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2309909
End bp	2311708
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	44%
IMG OID
Product	aspartate kinase
Protein accession	YP_003721340
Protein GI	298491163
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.175544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCTTA TAGTTCAGAA ATACGGTGGT TCATCTGTTG GTTCTGTAGA ACGTATCCAA 
GCGGTTGCAA AGCGGGTTTA CAAAACTGTG CAAGCAGGAA ATTCCGTTGT CGTAGTCGTT 
TCCGCGATGG GAAAAACCAC CGATGGACTG GTGAAACTAG CCAATGAAAT CTCTAAAAGT 
CCTAACCGTC GGGAAATGGA TATGCTGCTT TCCACTGGGG AGCAAGTCAC GATCGCTTTA 
TTGAGTATGG CTTTGCAGGA AATTGGACAA GCGGCAATTT CTATGACTGG CGCTCAGGTA 
GGAATTGTTA CCGAAGCTGA ACACACCCGC GCTCGGATTT TGCATATTGA AACAGGGCGT 
TTGATGGGGC AGATTAATTT AGGTAAAGTG GTTGTTGTGG CTGGATTCCA AGGTATTTCT 
AGCGCTAGAA AAATGGAAAT TACTACTTTG GGACGTGGTG GTTCTGACAC TTCTGCAGTA 
GCTTTGGCAG CGGCATTAGG GGCAAATTTC TGTGAAATTT ATACAGATGT ACCAGGTATT 
TTAACTACAG ACCCCCGCCT TGTCCCAGAA GCCCAGTTGA TGACAGAAAT CACCTGTGAT 
GAAATGCTGG AACTAGCTAG TTTAGGTGCG AAAGTATTAC ATCCCCGTGC GGTGGAAATA 
GCGAGGAATT ATGGTGTGCC TTTGGTGGTC CGCTCAAGTT GGACCGATCA ACCAGGGACT 
TGGGTCACAA CTTCCAGAAC TCAAGAGCGA TCGCTCGTCA ATTTAGAATT AGCTCGTCCT 
GTGGATGCGA TAGAATTTGA TATAAACCAG GCTAAATTCT CTTTGCTGCG TGTACCAGAT 
AAGCCGGGAG TGGCAGCGCG GTTATTTGGG GAAATTTCCC GGCAAAATGT TGATGTAGAT 
TTGATTATTC AGTCAATTCA TGAAGGTAAT ACTAATGATA TTGCTTTCAC AGTAAATACA 
CATATATTAA AACGCGATGA AGCTATAGCA GCCTCTATTG CCCCGGCTTT GAGAAGTCAA 
CCTAATTCAG ATGAAGCTGA AGTTTTAGTA GAAAGTAATA CAGCCAAAGT GAGTATTTCT 
GGGGCGGGAA TGATTGGCCG TCCTGGTGTG GCTGCCAAGA TATTTGCTAC CTTAGCGCAA 
GCTAAAGTAA ATATTCAAAT GATTTCTACC AGTGAAGTGA AAGTGAGTTG CTTGGTAGAT 
GCGACAGATT GCGATCGCGC TATTGTTGCT CTCTGTAACG CTTTTGAAAT TACTGCTTCC 
CCCGCTGTCC TTGCTTCCCC AACTCCTGAA TCTCCTGCTG TGCGTGGTGT TGCTTTAGAT 
ATGAATCAAG CGCGGTTAGC AATTCGCCAA GTTCCAGATC AACCAGGGAT GGCTGCAAAA 
TTGTTTGGAT TATTGGCAGA ATATAACATC AGCGTGGATA TGATTATTCA GTCCCAACGC 
TGCCGGGTAG TGGATGGTGT AACACGTCGG GATATTGCCT TTACTGTGGC TAGGATGGAT 
GTAGAAAACG CCCAACAAAA ATTAACCCAA GTAGCAGATG AACTAGGATG GGGTGAAGTA 
GTTTTAGATA ATGCGATCGC CAAAGTCAGT ATCGTTGGTT CTGGGATGGT AGGACAACCA 
GGTATTGCAG CCAAAATGTT TACAGCTTTA GCAGAAAATA AAATTAACAT CCAAATGATT 
GCTACTTCGG AAATTAAAAT TAGTTGTGTT GTGGGACAAG ATGAAGGTGT CAAAGCTTTA 
CAAGTCATTC ATACAGCTTT TGATTTAGCT GGTAGTGAAA AATTTGTAGT CCCAGTGTGA

Protein sequence

MALIVQKYGG SSVGSVERIQ AVAKRVYKTV QAGNSVVVVV SAMGKTTDGL VKLANEISKS 
PNRREMDMLL STGEQVTIAL LSMALQEIGQ AAISMTGAQV GIVTEAEHTR ARILHIETGR 
LMGQINLGKV VVVAGFQGIS SARKMEITTL GRGGSDTSAV ALAAALGANF CEIYTDVPGI 
LTTDPRLVPE AQLMTEITCD EMLELASLGA KVLHPRAVEI ARNYGVPLVV RSSWTDQPGT 
WVTTSRTQER SLVNLELARP VDAIEFDINQ AKFSLLRVPD KPGVAARLFG EISRQNVDVD 
LIIQSIHEGN TNDIAFTVNT HILKRDEAIA ASIAPALRSQ PNSDEAEVLV ESNTAKVSIS 
GAGMIGRPGV AAKIFATLAQ AKVNIQMIST SEVKVSCLVD ATDCDRAIVA LCNAFEITAS 
PAVLASPTPE SPAVRGVALD MNQARLAIRQ VPDQPGMAAK LFGLLAEYNI SVDMIIQSQR 
CRVVDGVTRR DIAFTVARMD VENAQQKLTQ VADELGWGEV VLDNAIAKVS IVGSGMVGQP 
GIAAKMFTAL AENKINIQMI ATSEIKISCV VGQDEGVKAL QVIHTAFDLA GSEKFVVPV