Gene Avin_12790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_12790
Symbol	rpoN
ID	7760221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1245473
End bp	1246939
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	60%
IMG OID	643804181
Product	RNA polymerase factor sigma-54
Protein accession	YP_002798480
Protein GI	226943407
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCGC AGCTGCAACA AGCCATCCGT CTGCTTCAAC TGTCGACCCT GGATCTGCAG 
CAGGAAATCC AGGAGGCCCT CGACTCCAAT CCCATGCTGG AACGTCAGGA GGACGCCGAG 
GACTACGACA GCCCGGATAT GCTGGGCGAG CATGGAGACC AGTCGACGCT CGACACCACG 
CCCGGCTCTT ACCAGGAAGG CTACGAGAGC GGGGCGGCCA GCGAGGATGG CGGTACCCTC 
GAAGAGGGCG ACTGGCACGA GCGGATTCCC AGCGAGCTGC CGGTGGATAC CGCCTGGGAA 
GACATCTACC AGACCAGTGC CAGCAACCTG CCGAGCACCG ATGAAGACGA GTGGGACTTC 
ACCACCCGCA CCTCCACGGG CGAGAGCCTG CAGAGCCATC TGCTCTGGCA GTTGAACCTG 
ACCCCGATGT CGGATACCGA TCGCCTGATC GCCGTCACTC TGATCGACAG CATCAACAGC 
GACGGCTATC TGGAGGCCGC CCTGGAGGAA ATCCTCGCCT CTCTGGACCC GGAACTGGGA 
GTCGAACTCG ACGAAGTGGA AATGGTGCTG CGCCGCATCC AGCAATTCGA ACCGGCCGGG 
ATCGCTGCCC GCGACCTCAG CGAATCGCTG CTGCTGCAAC TGCGCCAGCT ACCGCCCGAT 
ACCCCCTGGC TGGAAGAGGC GAAACGACTG GCCAAGGACT ATCTCGACCT GCTGGGTAAC 
CGCGACTTCA CCCAGTTGAT GCGACGCATG AAACTCAAGG AAGAAGAATT GCGTCCGGTG 
ATCGAGCTGA TCCAGAGCCT CAACCCTCGT CCCGGGGCCC AGATCGAGAG CAGCGAGCCC 
GAATATGTCG TGCCTGACGT CATCGTGCGC AAGCACAACG ACCGCTGGCT GGTGGAGCTC 
AATCAGGAGG CGGTGCCGCG CCTGCGCATC AACCCGCATT ACGCTGGCTT CATCAGACGC 
GCCGACGCCA GCGCCGACAA CACCTTCATG CGCAACCAAC TGCAGGAGGC GCGCTGGTTC 
ATCAAGAGCC TGCAAAGTCG CAACGAAACC CTGATGAAGG TTTCGACCCA AATCGTCGAG 
CACCAGCGCG GCTTTCTCGA CTACGGCGAA GAGGCCATGA AACCGCTGGT GCTGCACGAT 
ATCGCCGAGG CTGTCGGCAT GCACGAATCG ACCATCTCCA GGGTCACCAC CCAGAAATAC 
ATGCACACTC CACGCGGTAT TTACGAGCTG AAGTACTTCT TTTCCAGTCA CGTCAGTACC 
GCCGAAGGCG GTGAGTGCTC GTCCACGGCC ATCCGCGCCA TCATCAAGAA ATTGATTGCG 
GCGGAAAATC CGAAAAAGCC ATTGAGCGAC AGCAAGATCG CTGGTTTACT GGAAGAACAA 
GGCATACAGG TGGCTCGCCG TACAGTTGCC AAATACCGGG AATCGCTCAG TATTGCGCCT 
TCCAGCGAAC GCAAGCGGCT TATGTAA

Protein sequence

MTPQLQQAIR LLQLSTLDLQ QEIQEALDSN PMLERQEDAE DYDSPDMLGE HGDQSTLDTT 
PGSYQEGYES GAASEDGGTL EEGDWHERIP SELPVDTAWE DIYQTSASNL PSTDEDEWDF 
TTRTSTGESL QSHLLWQLNL TPMSDTDRLI AVTLIDSINS DGYLEAALEE ILASLDPELG 
VELDEVEMVL RRIQQFEPAG IAARDLSESL LLQLRQLPPD TPWLEEAKRL AKDYLDLLGN 
RDFTQLMRRM KLKEEELRPV IELIQSLNPR PGAQIESSEP EYVVPDVIVR KHNDRWLVEL 
NQEAVPRLRI NPHYAGFIRR ADASADNTFM RNQLQEARWF IKSLQSRNET LMKVSTQIVE 
HQRGFLDYGE EAMKPLVLHD IAEAVGMHES TISRVTTQKY MHTPRGIYEL KYFFSSHVST 
AEGGECSSTA IRAIIKKLIA AENPKKPLSD SKIAGLLEEQ GIQVARRTVA KYRESLSIAP 
SSERKRLM