Gene YpsIP31758_0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0441
Symbol	rpoN
ID	5386750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	517179
End bp	518612
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	49%
IMG OID	640863410
Product	RNA polymerase factor sigma-54
Protein accession	YP_001399434
Protein GI	153949825
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAG GTCTGCAACT CAAGTTCAGC CAACAACTGG CGATGACTCC GCAGCTTCAG 
CAAGCTATTC GCTTGTTGCA ACTTTCGACG CTTGAACTCC AGCAGGAGAT TCAGCTCGCG 
CTGGAGAGCA ACCCCCTTCT TGAGCAAACG GACCTTCATG AAGAGATAGA TGCTAAGGAA 
ACCGTGGACA GTGAATCGCT GGATACCCGC GAAGCACTAG AACAAAAGGA TATGCCGGAA 
GAATTACCGC TAGATGCCAC CTGGGATGAG ATTTACACCG CAGGTACCCC ATCCGGCATG 
GGCAATGATT ACAGTGACGA TGAACTGCCC GTCTATCAGG GTGAAACCAC CCAAACACTG 
CAAGACTATC TGATGTGGCA GGTGGATTTA ACACCGTTCA CTGAGACCGA CGCCGCCATT 
GCGACTTCTA TCGTTGACGC TGTTGATGAC ACTGGCTATC TCACTGTGCC GCTGGAAGAT 
ATTCTGGAAA GCATGGGTGA TGAGAACGTA GCGCTAGACG AAGTGGAAGC GGTACTCAAA 
CGTATTCAGC ATTTTGATCC CATCGGTGTC GCTGCCCGTA ACTTGCGCGA ATGCTTACTG 
GTACAGTTAT CACAATATGC CAAAGACACC CCTTATTTGG CCGAAGCGCG TCTGATCGTC 
AGCGAATATT TAGATTTGCT AGGCAACCAT GATTTCCGCA TGATGATCCG CTTGAGTCGG 
CTGAAAGAAG ATACACTTAA AGAAGCCATC GCGCTGATCC AATCACTGGA TCCACGGCCA 
GGTCAGTCGA TCAATACCGG GGAGTCTGAG TATGTCATCC CGGATGTTCT GGTTCGTAAA 
GAGAAAGGTA TCTGGACGGT GGAGCTGAAT GCCGATAGCA TCCCACGTCT AAAAGTTAAC 
CAACAATACG CAGCGATGGG CAATAGCGTC CGTAATGACA GTGACGGGCA GTTTATCCGT 
AGCAATTTGC AAGAAGCAAA ATGGTTGATC AAAAGCCTTG AAAGCCGCAA CGAAACGCTG 
CTAAAAGTAG CAAGATGTAT TGTAGAACAG CAAGTCGAGT TCTTTGAGAA AGGTGCAGAG 
TTTATGAAAC CCATGGTACT GGCTGATATC GCCCAGGCTG TGGATATGCA TGAATCAACA 
ATCTCTCGAG TGACCACGCA GAAATTCTTG CACAGTCCCC GAGGGATTTT TGAACTGAAG 
TATTTCTTCT CTAGCCACGT CAATACCGAT AGTGGGGGCG AAGCCTCTTC TACGGCGATC 
CGGGCGCTGG TGAAGAAATT AGTGGCGGCA GAAAACCCTG CCAAGCCATT AAGCGATAGT 
AAACTAACCA CTTTATTATG TGAACAAGGC ATTATGGTAG CACGGCGCAC CGTCGCAAAA 
TACCGAGAGT CGTTATCCAT CCCTCCGTCT AATCAACGTA AACAGTTGGT TTGA

Protein sequence

MKQGLQLKFS QQLAMTPQLQ QAIRLLQLST LELQQEIQLA LESNPLLEQT DLHEEIDAKE 
TVDSESLDTR EALEQKDMPE ELPLDATWDE IYTAGTPSGM GNDYSDDELP VYQGETTQTL 
QDYLMWQVDL TPFTETDAAI ATSIVDAVDD TGYLTVPLED ILESMGDENV ALDEVEAVLK 
RIQHFDPIGV AARNLRECLL VQLSQYAKDT PYLAEARLIV SEYLDLLGNH DFRMMIRLSR 
LKEDTLKEAI ALIQSLDPRP GQSINTGESE YVIPDVLVRK EKGIWTVELN ADSIPRLKVN 
QQYAAMGNSV RNDSDGQFIR SNLQEAKWLI KSLESRNETL LKVARCIVEQ QVEFFEKGAE 
FMKPMVLADI AQAVDMHEST ISRVTTQKFL HSPRGIFELK YFFSSHVNTD SGGEASSTAI 
RALVKKLVAA ENPAKPLSDS KLTTLLCEQG IMVARRTVAK YRESLSIPPS NQRKQLV