Gene Aazo_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4151
Symbol
ID	9341956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4224666
End bp	4225796
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	42%
IMG OID
Product	glutamate 5-kinase
Protein accession	YP_003722708
Protein GI	298492531
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCATG TCCCATGCCC CATGACTAAA ACAATAGTTG TTAAAATTGG TACTTCTAGC 
CTTACTCAAC GAGAAACTGG ACAACTAGCC CTTTCCACCA TTGCTACCTT AACGGAAACC 
CTGTGCAATT TAAGACTCCA GGGTCATCGC GTAATTTTGG TTTCTTCCGG TGCTGTGGGT 
GTGGGTTGTG CGTGTTTAGG TTTAACAGAA CGTCCCAAAG TGATCGCTCT CAAACAAGCG 
GTAGCAGCTG TTGGACAAGG TAGGCTAATA CGTATCTATG ATGATTTATT TACTACTTTA 
CAACAACCTA TAGCCCAAGT ATTATTAACA CGCGCTGATT TGGTACAACG TAGCCGCTAT 
CTAAATGCTT ACAATACTTT TCAGGAATTG CTACGACTAG GAGTAATTCC GGTAGTGAAT 
GAAAATGATA CTGTGGCTGT AGAGGAATTG AAATTTGGTG ATAACGACAC CCTTTCTGCT 
TTAGTTGCCA GTTTAGTGGA AGCGGATTGG TTATTTTTAC TGACAGACGT TGAGAAATTA 
TATTCTGCTG ATCCTCGTTC TGTACCTGAT GCCCGTCCTA TCAGTTTGGT AAGTAATATG 
AGGGAATTGG CAGATTTGCA AATTCAAACC GGGGGACAGG GTTCTCAGTG GGGTACTGGT 
GGAATGGTAA CAAAAATATC TGCTGCCAGA ATTGCGATCG CAGCGGGTGT GCGAACTATA 
ATTACTCAAG GGCGTTTTCC TCACAATATT GAGAAAATTA TCCAAGGGGA AGCTATAGGA 
ACGCATTTTG AACCGCAACC AGAACCAACC TCAGCTAGAA AACGCTGGAT AGCTTATGGT 
TTAGTACCGA TGGGTAAATT ATATTTAGAT GATGGGGCTA TTAATGCTAT TTCCCAAGCA 
GGAAAATCTC TGTTGGCTGC GGGAATTAAA GCTGTACAAG GGGAATTTGA CCATCAGGAA 
GCGGTACAAT TGTGCGATGG CACAGGTAAT GAAATTGCCA GAGGTTTGGT GAATTATAAC 
AGTGAAGAAT TACAAAAAAT TTGTGGTTGT CATTCACGGG ACATTGCGGG AATTTTGGGT 
TATGCAGGTG CGGAAACTGT AATTCATCGG GATAATTTGG TGTTGATTTA G

Protein sequence

MPHVPCPMTK TIVVKIGTSS LTQRETGQLA LSTIATLTET LCNLRLQGHR VILVSSGAVG 
VGCACLGLTE RPKVIALKQA VAAVGQGRLI RIYDDLFTTL QQPIAQVLLT RADLVQRSRY 
LNAYNTFQEL LRLGVIPVVN ENDTVAVEEL KFGDNDTLSA LVASLVEADW LFLLTDVEKL 
YSADPRSVPD ARPISLVSNM RELADLQIQT GGQGSQWGTG GMVTKISAAR IAIAAGVRTI 
ITQGRFPHNI EKIIQGEAIG THFEPQPEPT SARKRWIAYG LVPMGKLYLD DGAINAISQA 
GKSLLAAGIK AVQGEFDHQE AVQLCDGTGN EIARGLVNYN SEELQKICGC HSRDIAGILG 
YAGAETVIHR DNLVLI