Gene Aazo_1556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1556
Symbol
ID	9339348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1627849
End bp	1629471
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	43%
IMG OID
Product	GMP synthase large subunit
Protein accession	YP_003720867
Protein GI	298490690
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.185236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAG CGGTGACTCT ACCAACCAAA CAAGCACCTC AAGTACAAGA AAATTTGGGG 
GCTATTAATC GCCAAATAAT TGTTATTTTA GACTTTGGTT CTCAATATTC TGAACTAATC 
GCTCGGCGTA TCCGTGAGAC TCAAGTATAT TCTGAAGTTC TCTCCTATCG CACCACAGCA 
GAACATTTAC GCCAATTAAA TCCCAAGGGA ATTATCTTGT CTGGTGGGCC AAATTCAGTA 
TATAGCGATT ATGCGCCCCA TTGTGACCCA GAAATCTGGA ATTTGGGAAT GCCCATCTTA 
GGTGTATGCT ATGGAATGCA GTTGATGGTG AACCAACTAG GTGGGGAAGT CACCAAAGCT 
GAGCGAGGTG AATACGGCAA AGCACCATTA TATATAGATG ATCCCACCGA TTTGCTAACT 
AATGTTGAAG ATGGCACAAC AATGTGGATG AGTCATGGCG ATTCAGTCAC AAAAATGCCA 
TCTGGATTTG AACTATTGGC ACATACAGAA AATACTCCCT GTGCTGCTAT TGCTGACCAT 
GACAAGAAAC TTTATGGTGT ACAGTTCCAT CCAGAAGTGG TGCATTCCCT TGGTGGAATA 
GCATTAATTC GTAACTTTGT TTACCACATC TGCGACTGTG AACCCACCTG GACAACAGCA 
GCTTTTGTGG AAGAATCAAT TCGGGAAATT CGCGCTAGAG TTGGTGAGAA GCGCGTATTA 
TTGGCTCTTT CTGGGGGTGT AGATTCTTCC ACTCTGGCAT TTTTGCTGTA TAAAGCCATT 
GGTGAACAGC TAACTTGTGT CTTTATCGAC CAAGGCTTCA TGCGTAAGTT AGAGCCTGAA 
AGATTACTCA AACTATTCCA AGAACAGTTT CATATTCCGG TGGAATATGT CAATGCTCGC 
GATCGCTTTA TTAAAGCTAT TGCTGATATC ATAGACCCCG AAGAAAAACG CCGTCGCATC 
GGCCATGAAT TTATACGCGT ATTTGAAGAA ACCTCCAAAA AACTCGGTCA CTTTGACTAT 
TTAGCTCAAG GTACTCTCTA TCCTGATGTG ATTGAATCTG CTGATACTAA TGTTGACCCC 
AAAACCGGCG AACGAGTAGC AGTAAAAATT AAGAGTCATC ACAATGTTGG TGGTTTACCC 
AAAGACCTCA GATTTAAACT CGTTGAACCC TTGCGCAAAC TTTTTAAAGA TGAAGTCCGT 
AAAGTAGGTC GTTCCATTGG TTTACCAGAA GAAATTGTCC AAAGACAACC CTTCCCCGGC 
CCCGGTTTAG CAATTCGTAT CTTAGGCAAA GTCACAGCCG AAGGGTTAAA TATTTTACGC 
GATGCTGATT TAATTGTCCG CCAAGAAATC AATCAGTGCG GCTTGTATCA TGACTATTGG 
CAAGCATTTG CCGTATTATT ACCAATTCGG AGTGTAGGCG TAATGGGTGA TAAGCGTACC 
TACGCTTACC CCATAGTTTT ACGGATTGTC ACCAGTGAAG ATGGGATGAC AGCAGACTGG 
GCCCGTGTAC CTTACGATGT CCTAGAAGGA ATTTCTAACA GAATCGTCAA TGAGGTAAAA 
GGCGTTAACC GTGTGGTTTA TGACATCACT TCCAAGCCAC CGGGAACTAT CGAGTGGGAA 
TAG

Protein sequence

MNTAVTLPTK QAPQVQENLG AINRQIIVIL DFGSQYSELI ARRIRETQVY SEVLSYRTTA 
EHLRQLNPKG IILSGGPNSV YSDYAPHCDP EIWNLGMPIL GVCYGMQLMV NQLGGEVTKA 
ERGEYGKAPL YIDDPTDLLT NVEDGTTMWM SHGDSVTKMP SGFELLAHTE NTPCAAIADH 
DKKLYGVQFH PEVVHSLGGI ALIRNFVYHI CDCEPTWTTA AFVEESIREI RARVGEKRVL 
LALSGGVDSS TLAFLLYKAI GEQLTCVFID QGFMRKLEPE RLLKLFQEQF HIPVEYVNAR 
DRFIKAIADI IDPEEKRRRI GHEFIRVFEE TSKKLGHFDY LAQGTLYPDV IESADTNVDP 
KTGERVAVKI KSHHNVGGLP KDLRFKLVEP LRKLFKDEVR KVGRSIGLPE EIVQRQPFPG 
PGLAIRILGK VTAEGLNILR DADLIVRQEI NQCGLYHDYW QAFAVLLPIR SVGVMGDKRT 
YAYPIVLRIV TSEDGMTADW ARVPYDVLEG ISNRIVNEVK GVNRVVYDIT SKPPGTIEWE