Gene Aazo_4933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4933
Symbol
ID	9342739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	5048630
End bp	5049850
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	41%
IMG OID
Product	hypothetical protein
Protein accession	YP_003723189
Protein GI	298493012
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.342711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCTA ACCTCGTCAA TCTGCCAAAT TCCACACCTG CTTTTGATGG TGATATTTCA 
ACCGAAGACT TATCAGATAT TAACTCTGAG ACTTTATTGC AACTGCTTTG TCAGGAAATG 
CAGAGTCAGG TAAAAGCTTC AACTGGATGT GTGCAAGCCG TAACTAAACG CATAGCTAAA 
GAAGTAGAAC GGATATGTGA TAAAAGTTCC CGCATCCAAA CTTCAGGGCA AGTTAGGTCT 
TGGCAGATTA CTTTAGCAAG ACACCGTTTA CAAAAGTGCC TGCGTTACTA TCAATTAGGC 
TCAAAACAAG GGCGTGTAGA ATTACATAGT AGTTTAGGTG CTATTGTTTA TCGCCATGTT 
ACTGTTGCTG GCTCAGAATT AGGTTTTGAA GCTCGTTACA ATCTGATTGA AGATTTTCTG 
CAAGCTTTTT ATATTGAAGC GATTAAAGCT TTTCGCAGAG AAAATGAATT AGCTGAAGAT 
TACACACCAC GTACTCAACT ACAATTAGCT GAGTATATGG CTTTTACGGA GCAGTATGCT 
AAACGGCGGA TTAATTTACC TGGTGGTGCT AATCAACAGT TGATTGTGTT ACGCGCTCAA 
GGTTTTGCTC GTCGTCAACC CCAAGAAACG ACTGTAGATA TTGAAATGGC TGTGGATTCA 
GCTAAGACTG AAGAGGCAGA ATCTTATCAA CGTAATTTGG CCGTGCAACA AATTAGGTCA 
CAGATGGTTG CTAAACCTAA TTTTGATCCA TCTGAGGAGT CGGAACGCGA TCGCGTGATT 
ACAGAGTTGA TGAAATATCT GGAATCTCAA GGTCAAGCTG ATTGCATGGA TTACCTGTCT 
CTTAAACTTC AGGATCTCTC AGCACCGGAA ATTGACCAAA TTTTAGGATT AACTAGCCGT 
CAGCGCGATT ATTTGCAACA ACGCTTTAAG TATCACGTTG AGAAGTTTGC TAAACAACAC 
CACTGGCAAC TAGTACATCA ATGGCTGGGT GCTGGTTTAG AACATAAGTT GGGTTTATCT 
TCTCAGCAGT GGGATGCTTT TTGGAATCAA CTCACAGAAC AGCAACAGCA AATCTTTCAG 
CTAAAAACTC TAATGGAGAA TGATCAAGTG ATCGCTAAAG CTGTCCAATG TACCCCTAAA 
CAACTACAAA AACGCTGGAC TCAAATGCTA GAACTCGCAT GGGCTATCCG CAATGGTCAT 
GCTGAAGTTA AAACCTGCTG A

Protein sequence

MKANLVNLPN STPAFDGDIS TEDLSDINSE TLLQLLCQEM QSQVKASTGC VQAVTKRIAK 
EVERICDKSS RIQTSGQVRS WQITLARHRL QKCLRYYQLG SKQGRVELHS SLGAIVYRHV 
TVAGSELGFE ARYNLIEDFL QAFYIEAIKA FRRENELAED YTPRTQLQLA EYMAFTEQYA 
KRRINLPGGA NQQLIVLRAQ GFARRQPQET TVDIEMAVDS AKTEEAESYQ RNLAVQQIRS 
QMVAKPNFDP SEESERDRVI TELMKYLESQ GQADCMDYLS LKLQDLSAPE IDQILGLTSR 
QRDYLQQRFK YHVEKFAKQH HWQLVHQWLG AGLEHKLGLS SQQWDAFWNQ LTEQQQQIFQ 
LKTLMENDQV IAKAVQCTPK QLQKRWTQML ELAWAIRNGH AEVKTC