Gene Aazo_2093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2093
Symbol
ID	9339887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2179509
End bp	2180915
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	35%
IMG OID
Product	histidine kinase
Protein accession	YP_003721257
Protein GI	298491080
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.578999
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGCTA TGCATAGCAT GAAAGGTGCT TATAAGTTGA ATCTAAAACT AGAGTCGACT 
TTGGAGGAGT TACCAGTTTG GACTGTTCAA ATCGAACTAA ATCAGCCAGG AAATGAACTA 
GCTAAACTTT TTGATCAAGA GCCTTTATTA CCAGGAATTA TCTTGACTAA AAATCAGAAA 
TGTGTAGGCA TGATTTCCCG ACCACTATTT TTTGAGCAAA TGAGCCGTCC TTATGGGTTA 
GGGCTATTTG CTGGTCGGCC TATTGAATAT CTTTACAATG TTCTGCTACC AGAGATATGT 
ATCCTATCTG AGGATACTCC CATTGTGGAT GCAACTCAGA CAGCATTAGA ACGATCCGCT 
AAACTTGTTT ATGAACCGAT TGTAATTACA GATCAATCTA GTCAGTATGG ATTACTCGAT 
TTCCATCACT TACTTTTAGC TTACTCTCAA ATCCATGTTT TAACACTTAA TCGACTCCAG 
AAAGAAAAAG AACTTACTAG CATAGCAAGA GCAGACTTCC GCAACCTTCA ACACAACTAT 
ACTCGACTAT TACAAAATGA AAAAATGATT GCCCTGGGAC AACTTGTAGC GGGTATTGCC 
CACGAAATCA ATAATCCCAT GAACTTTATC TATGGTAATC TTAACTATGC CACTAAATAT 
GTACAAGACC TCATATACCT AGTTGAATGT TATCAAGAAG AACCTTCTTA CTCTGAAGTA 
GTATTGCGAG CCAAAAAAAG AGGTATTGAA ATTGAATTTA TCATGGAAGA TTTGCCAAGA 
TTGTTATCTT CTATGAAAGT TGGTGCAACC AGAATTAATG AAATTGTCTT ATCTCTACGG 
AATTTTTCCA GACTAGATCA AGCAGAAATA AAATCAGTTG ATATTCATGA AGGGATAGAA 
AATACATTAA CAATTCTTCA GCATAACTTG AAAGCTAAAC CTGATCGTCC AGAAATTAAA 
GTAATTAAAG ATTATGGTAA TCTGCCATTA GTAGAATGCT ATGCTGGTCA ACTTAATCAG 
GTATTTATGA ATATAATATC TAATGCTATT GATGCCCTTT CCGAAAGTTA TCAAATATGT 
ATTTGCGGTC ATCATTTAAC TTCCCATAAT CAAAAAGATA TGACAATTAC TATTCGTAGT 
GAAGTCAATA AGGACAATCA GGTAATGATT GGCATTGCTG ATAATGGACC AGGAGTACCA 
GAGAATATCC AAAAACGTGT ATTTGATCCA TTTTTCACTA CCAAGTCTGT AGGTAAAGGA 
ACTGGATTAG GATTATCCAT CAGCCACCAA ATTGTGGTAC AAAAACATGG TGGTCAAATT 
TACTGTTTAT CGCAGCCAGG ACAAGGCTCT GAATTTATTA TTAAAATTCC CATTATTTCG 
GACAAAAATA ATTTAAATAA TAAGTAG

Protein sequence

MLAMHSMKGA YKLNLKLEST LEELPVWTVQ IELNQPGNEL AKLFDQEPLL PGIILTKNQK 
CVGMISRPLF FEQMSRPYGL GLFAGRPIEY LYNVLLPEIC ILSEDTPIVD ATQTALERSA 
KLVYEPIVIT DQSSQYGLLD FHHLLLAYSQ IHVLTLNRLQ KEKELTSIAR ADFRNLQHNY 
TRLLQNEKMI ALGQLVAGIA HEINNPMNFI YGNLNYATKY VQDLIYLVEC YQEEPSYSEV 
VLRAKKRGIE IEFIMEDLPR LLSSMKVGAT RINEIVLSLR NFSRLDQAEI KSVDIHEGIE 
NTLTILQHNL KAKPDRPEIK VIKDYGNLPL VECYAGQLNQ VFMNIISNAI DALSESYQIC 
ICGHHLTSHN QKDMTITIRS EVNKDNQVMI GIADNGPGVP ENIQKRVFDP FFTTKSVGKG 
TGLGLSISHQ IVVQKHGGQI YCLSQPGQGS EFIIKIPIIS DKNNLNNK