Gene Aazo_4090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4090
Symbol
ID	9341895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4155497
End bp	4156780
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	41%
IMG OID
Product	hypothetical protein
Protein accession	YP_003722662
Protein GI	298492485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAA ACAAGGATAA TTTATTACTG AAGGCTGCAA AAACTGGCAA TATCAAAAGG 
CTGTATGAGC TACTAGCGAG TGGTGCTAAG GTGGATGGAT GCGATCACGA TGGTACGACA 
GCATTAATGT TTGCTGCTAA TCTAGGTTAT ACAGAAATTG TGCGATCGCT CTTAGATTGT 
GGCGCTAAGA TCAATCTACC TAGAAAAACT TATCGTTTAA CAGCGTTAAT GCTGGCAGCT 
AGTAGCAATC AAATTGATAT TATCAAGCTT TTAATATCTA AAGGTGCAGA AATAAATGCC 
ATTAATGATG ATGGCAGCAC TGCTTTAATG GCCGCAGCCC AGAAGGGTCA TCTTGAAGTA 
GTCCAAGTCC TCTTAGCTGC CGGTGCTGAT GCCAACATCG CTGATAAAGA TGATGACACA 
GCTTTAAAAC TAGCCATCAA GCAAGACTAC ACAGCAGTTG TTAAAGCAAT ACTACAAAAT 
AGTGAAATTG TCAATATTCC AGATGCAGAA GGTGAGACAC CTTTAATGAT AGCCGCAGAC 
TTGGGATATT TAGATGTAGT ACAAACATTG TTGTCAGCAG GGGCTGATAC TAATTTACAA 
AATCCCGATG GTAACACTGC GCTATTAGCA GCCGCAGCCG CAGGACACGG TAATATCGTT 
GCTGCTTTAT TAGATGCACA TGGGAAAATT AATCACCAAG ATAAAGAAGG TGAAACTGCC 
CTCCACTGTG CTGTTGTCGA AGGCTACCTT GATGTAGTAC AAATTTTAAT TCAGTGGGGT 
GCAGATGTAC AAATTAGAAA TCATCTTGGC GATACACCCC TACTTGTAGC CACATTTCAG 
GGATACAGCG AAATAGTTGA AGCTTTGCTG CGAGCTAACG CAAATATGGA TGAGAAAAAC 
TTTGGTGAAG TTGCCCTCAC ATTGGCAGTA TCCCAAGGAC ATACCCAGAC CGTCAAAATA 
TTACTTGACC ACGGTGCTAA TATTAATACA TTAGCAGATG ATGGAAAAAC CGCTTTAGTC 
AAAGCCATAG CCAGCAACCA TCCAGAAGTA TTCAAACTCC TGCTAGAAAA AGGGGCAGAT 
GTAAATTTTC AAGACTCAGT CGGCGCAACA GCGTTAATGT GTGCTGCTGC TGAAGGTTAT 
AGTCAAGCTG TGCAGATTTT AGTTACATCT GGCGCAGATG TGAATTTAAA AAACCAAGGT 
GGTTATACAG CTTTAATGAT TGCTGAATTT AATAACTATC GCACAATTGC CCAAATTTTA 
CGACAAGCTG GAGCGCAGGA ATAA

Protein sequence

MTENKDNLLL KAAKTGNIKR LYELLASGAK VDGCDHDGTT ALMFAANLGY TEIVRSLLDC 
GAKINLPRKT YRLTALMLAA SSNQIDIIKL LISKGAEINA INDDGSTALM AAAQKGHLEV 
VQVLLAAGAD ANIADKDDDT ALKLAIKQDY TAVVKAILQN SEIVNIPDAE GETPLMIAAD 
LGYLDVVQTL LSAGADTNLQ NPDGNTALLA AAAAGHGNIV AALLDAHGKI NHQDKEGETA 
LHCAVVEGYL DVVQILIQWG ADVQIRNHLG DTPLLVATFQ GYSEIVEALL RANANMDEKN 
FGEVALTLAV SQGHTQTVKI LLDHGANINT LADDGKTALV KAIASNHPEV FKLLLEKGAD 
VNFQDSVGAT ALMCAAAEGY SQAVQILVTS GADVNLKNQG GYTALMIAEF NNYRTIAQIL 
RQAGAQE