Gene Aazo_2854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2854
Symbol
ID	9340654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2936643
End bp	2938268
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	40%
IMG OID
Product	hypothetical protein
Protein accession	YP_003721818
Protein GI	298491641
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA CAAAGCAGAA ATCTCTGCGT GGAAAAAAGC AATCTTCACC AGAGAAAACC 
CGCCTGAGCT TGAAAGAAGA GTTAGCCCAA AAGCGCAAAG CCACCATAGC ACGTAAAGAG 
TTGACCAGCT TAGTTGGCAA ACTGGTAGGA AGCGGACTAT TTTTAGGAAT GCTGCTATTT 
TTCGTCGGTG GAATTAAATT AGCAGTTCCT GGTGCATTAG GTATCATAGT CATTACCCTT 
TGTTATAAAA ACCCGCTACC TGCTCTATTT GCCTTTGTTA TGTATGTACC ATTCGCCGGT 
ACTATTATTT ACTTCTTGGG CAACAGTCCT GTACTTCAAC TAGCTAAAGA TGCTTTCTAT 
GTTCCAGTAG TGATCGCTCT GTGGCAAAGT TGCAAAAAGC AAAAACAACC CTTCATTATT 
CCTCAATCCA TCAAAACCCC ATTTTTGATT CTCCTTAGCT GTTCTATCCT CACCCTAGTG 
ATGATAAATG GTGGACAGCA GTTAAATCCG GCTCGTGGCG ATATACCTAT AGGCATAGGA 
ATTCTGGGAT TAAAAGTATT TCTAGGATAT TTTCCTGTAA TTACTTGCGT CTATTACCTA 
ATTCTTAATC AGCAGGATTT TTGGTTGTTA TCCCGCCTTC AGATTCTCCT CATACTAGTC 
TGCGGCATCT TGGGAGTTAT TCAATTTATC TTCCTCACAA TTGGAGTATG TAAAGGGACG 
GTAGGCGTTG AAGGAGACGC TTTATTTAAG GCAACACTTG ATGCTCGGTG TTTAGTTGGT 
GGTGCGCTCT TATACACACC AGAACAAGGA GTAATTCGCT TACCAGGAAC ATTTGTAGCC 
CCTTGGCAGT GGGCATGGTT CTTAATTTCC AGCACCTTTT TTACATTTGC TACAACTTTT 
AGCGACAAAT CTATTATTTG GCGGCTGATC AGTTTGGTTA CTTTAGGATT AGTCTTTTTT 
AACGCAGTTA TCTCTGGACA AAGAATAGCC TTAGCTTTAG TACCAGTATG TTTCGCGCTT 
TTGTTGTTGT TAACTGGTCC ATTGGTCAAC CTCAAAAAGG TTATCCCCTT GGGAGGAGCT 
TTCGCTGTAA TTTTGGTAAT TGCAATGGCA GCTAATCCCA CTATCGTACA AGACAGAATG 
AACAGTTTTA TCGGTCGATG GAATGCATCA CCACCTCATC ACTTTATAGT TGATCAATTG 
CAAGAAAACT GGAAAAGTGT TGATACTCCT ATAGGTAGCG GCTTAGGTCG AGCTACGAAC 
TCTGCCCGTG TATTTGGTTC AACCAAGTTG GTGGAAACCT ACTATCCTAA AGTGCTGTAT 
GAAGTTGGAA TTGTCGGAGT CTTGGCTTTT TTGGTCTTTG TCACCAGTCT AACCGTTGCT 
ACTTTTAAGA CATATCGCAC AATAAAAAAC CGTAACTTAC GAACCTATGG TGCTAGTATG 
TGGGTGTTCG TACTATTTAT CAGTTACAAT ACTTACTACT ACCCCCTAGA TGTCGATCCA 
GTTGCTGTTT ATTATTGGTT GTGTGCAGGA ATAATATTCA AATTACCAAT TCTGGATAAA 
CAAGAAATGC CAGAAGAAAC AACCATCAAT ACCAAAGGTC AGAAAAAACG GCTGTATCAA 
AAATAA

Protein sequence

MAKTKQKSLR GKKQSSPEKT RLSLKEELAQ KRKATIARKE LTSLVGKLVG SGLFLGMLLF 
FVGGIKLAVP GALGIIVITL CYKNPLPALF AFVMYVPFAG TIIYFLGNSP VLQLAKDAFY 
VPVVIALWQS CKKQKQPFII PQSIKTPFLI LLSCSILTLV MINGGQQLNP ARGDIPIGIG 
ILGLKVFLGY FPVITCVYYL ILNQQDFWLL SRLQILLILV CGILGVIQFI FLTIGVCKGT 
VGVEGDALFK ATLDARCLVG GALLYTPEQG VIRLPGTFVA PWQWAWFLIS STFFTFATTF 
SDKSIIWRLI SLVTLGLVFF NAVISGQRIA LALVPVCFAL LLLLTGPLVN LKKVIPLGGA 
FAVILVIAMA ANPTIVQDRM NSFIGRWNAS PPHHFIVDQL QENWKSVDTP IGSGLGRATN 
SARVFGSTKL VETYYPKVLY EVGIVGVLAF LVFVTSLTVA TFKTYRTIKN RNLRTYGASM 
WVFVLFISYN TYYYPLDVDP VAVYYWLCAG IIFKLPILDK QEMPEETTIN TKGQKKRLYQ 
K