Gene Aazo_4098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4098
Symbol
ID	9341903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4164549
End bp	4166054
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	41%
IMG OID
Product	histidine kinase
Protein accession	YP_003722668
Protein GI	298492491
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTACGAAT GGATCTTGCC AAGTCTGAGA GAAGTTTTAG CCTATAGCCA ATCAACTATG 
GCTGAGTGTT CATCTGCCAA AGCAGAGCAG CAATGGCGCA TCAGTTTAGC TGCTACTGAA 
CATCTACTAC TCAAAACTTT AGCACCCACT ACCCCTAATA TCACTCAAGG TTTGGTTCTA 
ACTGCACCAG CACCCTTATT TAGTCAGCCA AAACTAACTC AAAGTTTACA AACAGTAACT 
TTTACAGCCA AACCTTTTAA CCCGTTGGCT TTGATGCCGT TTCATATCTC ACCAGCGATG 
GTGCAGAGTG GTGGGAAAGA GGTAATGTGT ACTCTGGAAA ACTCACCGGG AATGACAGAC 
TGTGCTTACG CACACACAGA AATCAATCCA GAGGAATCCA TATTACCTTT ATTACCTGCC 
GATCCTCTGG GATCAGAACA ATTTTGCTTG GTATTCACAG AAAAATTTAG ATTAGTTCTG 
GTTTTGTCAG AACACATAAG CGGTAAAAAA GAATTTTTAT TTTCATTTGA ACCAGAAGTA 
GTACAACAGG CTTGGCACGC ATTAGGTGCA AGGGTTGTTC TGACTAATCC AGATTTATTC 
GCTGAGTTGG ATGTTTTAGT TCAGCAATAT TCCCCAGTTG TAGCAGATTA TCAAACGGTA 
ATTCAATTTA GCCAGTTGTT GCTTCAGGAA TTAGCAGAGC CAGAAGCAGA TAAAGCAGTA 
CATAATCCTC CCATTTCTCC ACTTCCTCAT ATTCCCACTT CCCCATCACC AAAACTATCT 
TCCCGTTCTG ATGTAGAATT ACTACAAGCC TTTGCTCACG AAGTCCGCAC ACCATTAGCG 
ACTATTCGCA CTCTTACTCG TCTGCTACTG AAGCGGCGGG ACTTATCTAT TCCCGTAATT 
AAGCGATTAG AAGTAATTGA CCACGAGTGT ACTGAGCAAA TTGACCGCAT GGAGTTATTG 
TTTAAAGCGG CAGAATTACA AACTTGTTCT GCCGCAAAAT CTGCCAATAC ACAATTAACT 
CCCATGTCTT TGGATCAAGT ATTACAGCAA AGTATCCCTC GTTGGCAACA AGCAGCAACA 
CGACGGAATT TAACTTTAGA TGTGGCTTTA CCCCAGCAAC TGCCAACTGT GGTCAGTAAT 
CCCGCTATGC TAGACCGGGT ACTTACGGGT TTAATGGAGA ACTTTACCCG CAGTTTACCC 
CCTGGAAGTT CTATTCAAGT TCAAGTTATT CCCGCTGGTG ATCAACTCAA ATTACAATTA 
TCTCCTCAAT TAGATTGCCA AGATACAACT AGAACTGCAA CACTACCAAT TCGTAAATCT 
CTTGGTCAGC TATTAATGTT TCAACCAGAA ACTGGAACAA TTAGTTTAAA TATTGCTGCA 
ACTAAGCATC TATTTCAGGC AATTGGTGGT AAGTTAATTG TCCGTCAAAA TCCCAAGTAT 
GGAGAAGTAT TGACGATTTT TTTACCTTTG GAAGTCAACA GCAAACAAAA GGTAAAATTC 
ACTTAA

Protein sequence

MYEWILPSLR EVLAYSQSTM AECSSAKAEQ QWRISLAATE HLLLKTLAPT TPNITQGLVL 
TAPAPLFSQP KLTQSLQTVT FTAKPFNPLA LMPFHISPAM VQSGGKEVMC TLENSPGMTD 
CAYAHTEINP EESILPLLPA DPLGSEQFCL VFTEKFRLVL VLSEHISGKK EFLFSFEPEV 
VQQAWHALGA RVVLTNPDLF AELDVLVQQY SPVVADYQTV IQFSQLLLQE LAEPEADKAV 
HNPPISPLPH IPTSPSPKLS SRSDVELLQA FAHEVRTPLA TIRTLTRLLL KRRDLSIPVI 
KRLEVIDHEC TEQIDRMELL FKAAELQTCS AAKSANTQLT PMSLDQVLQQ SIPRWQQAAT 
RRNLTLDVAL PQQLPTVVSN PAMLDRVLTG LMENFTRSLP PGSSIQVQVI PAGDQLKLQL 
SPQLDCQDTT RTATLPIRKS LGQLLMFQPE TGTISLNIAA TKHLFQAIGG KLIVRQNPKY 
GEVLTIFLPL EVNSKQKVKF T