Gene Aazo_4126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4126
Symbol
ID	9341931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4194873
End bp	4196789
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	46%
IMG OID
Product	acetolactate synthase large subunit
Protein accession	YP_003722686
Protein GI	298492509
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGTTCAC AAAGTGTCTC CGCAGGAGAA TCGCCTTCTC AAATCAGTCT CCCACAATCT 
GAAAATAACA AAAAGTCTCC TATCTCTAAC TCGCCAATTG TCGCTCCTAC AAGGGCTTCT 
GGCGGTTTTG CCTTGTTAGA TAGTCTCCTC CGTCACGGTG TTGAGTACAT TTTTGGTTAT 
CCCGGTGGGG CAATTCTACC GATTTATGAT GACCTGTATA AAGTGGAGGC AAGCGGTATA 
ATTAAGCATA TTCTTGTCAG ACATGAACAA GGTGCTTCCC ATGCGGCTGA CGGCTACGCC 
CGCGCTACAG GTAAAGTAGG AGTGTGTTTT GGGACTTCTG GTCCTGGGGC AACTAACTTG 
GTGACAGGTA TTGCCACAGC TTACATGGAT TCCATTCCGA TGATTGTGGT GACAGGACAA 
GTACCACGAG CGGCAATTGG TACAGATGCT TTCCAAGAAA CGGATATCTA CGGTATTACT 
CTGCCCATTG TCAAGCATTC TTATGTAGTC CGTGACCCCA AAGATATGGC GCGGATTGTG 
GCTGAAGCCT TCCATATTGC CAATACAGGC AGACCAGGAC CAGTTTTGAT AGATGTTCCC 
AAAGATGTGG CTTTGGAAGA ATTTGATTAT GTGCCTGTAG AACCTGGTTC AGTCAAGTTA 
CCTGGATATC GTCCTACAGT TAAAGGTAAT CCCCGACAAA TTAATGCGGC GATTCAGTTG 
ATTACGGAAA GTGGTAGACC CTTATTATAT GTTGGTGGGG GTGTGATCGC AGCGAATGCC 
CACGCAGAAG TTAAACGTCT GGCAGAATTA TTTAATATCC CCGTCACCAC AACCCTCATG 
GGTATCGGTG CATTTGATGA ACATCATCCC CTATCTTTAG GAATGTTGGG GATGCACGGT 
ACTGCTTACG CTAATTTTGC GGTTACAGAT TGTGATTTGC TGATTTGTGT TGGTGCAAGA 
TTTGATGACC GTGTAACAGG AAGATTAGGT GAATTTGCTT CCCGTGCTAA AGTCATTCAC 
ATCGACATTG ACCCGGCAGA AGTTGGTAAA AACCGCGTTC CTGAAGTTCC TATCGTTGGC 
GATGTCAAGA GTGTTCTAAC TGATTTACTC CGGCGATGTC AAGACGCAAC GGGAAAAACT 
ACACCTAATC AAAATCAAGA ATGGTTAAAT CTAATTAACC GTTGGAAACA AGATTACCCC 
TTGGTTGTGC CTCATCATGC TGACAGCATT TCTCCCCAAG AGGTAATTGT GGCAGTTGGG 
AGTCAAGCAC CCAATGCTTT TTATACCACC GATGTTGGTC AACATCAAAT GTGGGCAGCA 
CAATTCCTCA AAAATGGACC TAGACGCTGG ATTTCTAGCG CCGGTTTAGG AACAATGGGT 
TTTGGTGTCC CTGCGGCTAT GGGTGCTAAA GTGGGCTTCC CTGATGAAGA AGTGATCTGT 
ATTAGCGGTG ATGCCAGTTT CCAAATGTGC TTACAGGAAC TGGGAACTAT AGCACAGTAT 
GGGATAAATA TCAAGACTGT AATTTTAAAT AACGGTTGGC AGGGAATGGT GCGTCAATGG 
CAAGAAGCCT TTTATGGTGA ACGTTATTCC TGCTCAAATA TGGAAGTAGG GATGCCAGAT 
ATTGAGCTGT TAGCACAGGC TTATGGGATC AAAGGGATGG TGATTAGCAG CCGGGAAGAA 
TTGGCAGATA AAATTGCCGA AATGCTGGCA CACAATGGAC CGGTGATTGT CGATGTTCAT 
GTTACCAGAG ATGAAAACTG CTATCCGATG GTAGCCCCTG GCAAGAGTAA CGCGCAGATG 
TTTGGTTTGC CAAAACCTCC ACCCACAAAT ACAGATGAGC CAGTTGCTTG CAGTCATTGT 
GGGACAAAAA ACTCGCCTAA CCATAACTTC TGTTCTGAGT GCGGCACTAA GTTGTAA

Protein sequence

MRSQSVSAGE SPSQISLPQS ENNKKSPISN SPIVAPTRAS GGFALLDSLL RHGVEYIFGY 
PGGAILPIYD DLYKVEASGI IKHILVRHEQ GASHAADGYA RATGKVGVCF GTSGPGATNL 
VTGIATAYMD SIPMIVVTGQ VPRAAIGTDA FQETDIYGIT LPIVKHSYVV RDPKDMARIV 
AEAFHIANTG RPGPVLIDVP KDVALEEFDY VPVEPGSVKL PGYRPTVKGN PRQINAAIQL 
ITESGRPLLY VGGGVIAANA HAEVKRLAEL FNIPVTTTLM GIGAFDEHHP LSLGMLGMHG 
TAYANFAVTD CDLLICVGAR FDDRVTGRLG EFASRAKVIH IDIDPAEVGK NRVPEVPIVG 
DVKSVLTDLL RRCQDATGKT TPNQNQEWLN LINRWKQDYP LVVPHHADSI SPQEVIVAVG 
SQAPNAFYTT DVGQHQMWAA QFLKNGPRRW ISSAGLGTMG FGVPAAMGAK VGFPDEEVIC 
ISGDASFQMC LQELGTIAQY GINIKTVILN NGWQGMVRQW QEAFYGERYS CSNMEVGMPD 
IELLAQAYGI KGMVISSREE LADKIAEMLA HNGPVIVDVH VTRDENCYPM VAPGKSNAQM 
FGLPKPPPTN TDEPVACSHC GTKNSPNHNF CSECGTKL