Gene Aazo_0565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0565
Symbol
ID	9338351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	591624
End bp	592877
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	43%
IMG OID
Product	RpoD subfamily RNA polymerase sigma 70 subunit
Protein accession	YP_003720184
Protein GI	298490007
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGCAA CATCTTTTCA TACAGATACC GCTTACGATT CCCCAAGGTC TAATCCAAAA 
TTAGAGCCTG ATTTGGGTAT TGATGATGGT GATTTTTCCC TAGATGATCT ACAGGATTTG 
GATATAGCTG CTGCTGTTGA TTCTCATAAT CTAGCTGCAA ACACTAACCG TCGCAGCACA 
GACTTAGTAC GTTTATACCT GCAAGAAATT GGTCGGGTGC GTTTGTTGGG GCGGGATGAA 
GAAGTTTCCG AAGCTCAAAA AGTGCAGCGG TATTTGCGGT TGCGGATAGT GCTTGCTAAT 
GCTGCCAAGC AAGGTGATAC TGTGATTGTA CCCTATCAGC GGTTAATAGA AGTTCAGGAG 
CGTTTGTCAT CTGAACTGGG ACATCGTCCA TCATTGGAAA GATGGGCTAA GACTGCTGGT 
ATAGACTTAG CGGATTTGAA GCCAACTTTG TTAGAGGGTA AACGTCGTTG GGCTGAGATT 
GCCAAATTGA AAGTAGAAGA ACTGGAAAAT GTTCAATCCC AAGGACTCCA AGCCAAGGAA 
CACATGATTA AGGCGAATCT TCGTCTGGTG GTTTCTGTGG CCAAGAAATA TCAAAATCGT 
GGTTTGGAAT TGTTAGATTT AGTCCAAGAA GGGACTCTGG GTTTAGAGCG AGCTGTGGAA 
AAATTTGACC CAACTAAGGG TTATCGTTTT AGTACCTATG CTTATTGGTG GATTCGTCAG 
GGAATTACCA GAGCGATTGC TACCTCTAGC CGGACAATTC GCCTCCCTGT TCATATTACA 
GAAAAACTGA ACAAAATTAA AAAAGCACAA CGTAAAATCT CTCAAGAGAA AGGTCGTACT 
CCCACTTTAG AAGATCTAGC AATTGAATTA GACATGACAC CTACTCAAGT TCGGGAAGTG 
TTGTTGAGAG TACCCCGTTC TGTTTCTTTA GAAACCAAAG TCGGAAAAGA TAAAGATACC 
GAGTTAGGGG AATTGCTAGA GACTGATAGT ATCACCCCAG AAGAAATGTT AATGCGGGAA 
TCTTTACAAA AAGATTTGCA CCATTTACTG GCAGATTTAA CCAGTCGAGA ACGGGATGTG 
ATCCTGATGC GGTTCGGTTT ATCTGATGGT CATCCTTACT CCTTGGCCGA AATTGGTCGC 
GCTCTAGATT TATCACGGGA ACGGGTACGA CAAATTGAAT CCAAAGCTTT GCAAAAGCTT 
CGTCAACCTA AGCGCCGTAA CCTGATTCGG GACTATTTGG AATCTTTGAG TTAG

Protein sequence

MPATSFHTDT AYDSPRSNPK LEPDLGIDDG DFSLDDLQDL DIAAAVDSHN LAANTNRRST 
DLVRLYLQEI GRVRLLGRDE EVSEAQKVQR YLRLRIVLAN AAKQGDTVIV PYQRLIEVQE 
RLSSELGHRP SLERWAKTAG IDLADLKPTL LEGKRRWAEI AKLKVEELEN VQSQGLQAKE 
HMIKANLRLV VSVAKKYQNR GLELLDLVQE GTLGLERAVE KFDPTKGYRF STYAYWWIRQ 
GITRAIATSS RTIRLPVHIT EKLNKIKKAQ RKISQEKGRT PTLEDLAIEL DMTPTQVREV 
LLRVPRSVSL ETKVGKDKDT ELGELLETDS ITPEEMLMRE SLQKDLHHLL ADLTSRERDV 
ILMRFGLSDG HPYSLAEIGR ALDLSRERVR QIESKALQKL RQPKRRNLIR DYLESLS