Gene ECD_03067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03067
Symbol	rpoN
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3213217
End bp	3214650
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	53%
IMG OID
Product	DNA-directed RNA polymerase subunit N
Protein accession	ACT44871
Protein GI	253979201
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0010606
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAG GTTTGCAACT CAGGCTTAGC CAACAACTGG CGATGACGCC ACAGCTCCAA 
CAGGCAATTC GTCTGTTGCA GTTGTCGACG CTGGAACTTC AGCAGGAGCT ACAGCAGGCG 
CTGGAGAGTA ATCCGCTGCT TGAGCAAATC GACACTCATG AAGAAATCGA CACCCGCGAA 
ACGCAAGACA GTGAAACGCT GGACACCGCC GACGCGCTCG AACAAAAAGA GATGCCGGAA 
GAGCTGCCGC TCGATGCCAG TTGGGACACC ATTTACACCG CTGGTACACC ATCCGGCACC 
AGCGGTGACT ACATTGACGA TGAGCTGCCG GTCTATCAGG GCGAAACGAC GCAGACCTTG 
CAGGATTACC TGATGTGGCA GGTCGAGCTG ACACCGTTTT CCGACACTGA CCGCGCTATT 
GCTACCTCTA TCGTCGATGC CGTTGATGAC ACCGGTTATC TGACTGTCCC GCTGGAAGAT 
ATTCTCGAAA GTATGGGCGA TGAAGAGATC GACATCGACG AGGTTGAAGC CGTCCTTAAG 
CGGATCCAAC GGTTTGATCC GGTCGGTGTA GCGGCAAAAG ATCTGCGTGA CTGCCTGCTA 
ATCCAACTCT CCCAATTCGA TAAAACCACG CCGTGGCTGG AAGAGGCCAG ACTGATCATT 
AGCGATCATC TCGATCTGTT AGCCAATCAC GACTTCCGCA CTTTAATGCG CGTCACGCGT 
CTGAAAGAAG ATGTGCTGAA AGAAGCCGTC AATCTGATCC AGTCGCTCGA TCCGCGCCCC 
GGGCAGTCGA TCCAGACTGG CGAACCTGAG TATGTCATTC CAGATGTGCT GGTGCGTAAG 
CATAACGGTC ACTGGACGGT AGAACTCAAC AGTGACAGCA TTCCGCGTCT GCAAATCAAC 
CAGCACTACG CCTCGATGTG CAATAACGCG CGCAACGATG GTGACAGCCA GTTTATCCGC 
AGCAATCTGC AGGATGCCAA ATGGTTGATC AAGAGTCTGG AAAGCCGTAA CGATACGCTA 
CTGCGCGTGA GTCGCTGTAT CGTTGAACAG CAGCAAGCCT TCTTTGAGCA AGGTGAAGAA 
TATATGAAAC CGATGGTACT GGCCGATATC GCCCAGGCTG TCGAAATGCA TGAATCGACG 
ATATCTCGCG TGACCACGCA AAAATACCTG CATAGTCCAC GAGGCATTTT TGAACTGAAG 
TATTTCTTTT CCAGTCACGT CAATACCGAG GGCGGCGGCG AAGCTTCCTC CACGGCGATT 
CGTGCGCTGG TGAAGAAATT AATCGCGGCG GAAAACCCAG CGAAACCGTT GAGCGACAGC 
AAGTTAACCT CTTTGCTGTC GGAACAAGGT ATCATGGTGG CACGCCGCAC TGTTGCGAAG 
TACCGAGAGT CTTTATCCAT TCCGCCGTCA AACCAGCGTA AACAACTCGT TTGA

Protein sequence

MKQGLQLRLS QQLAMTPQLQ QAIRLLQLST LELQQELQQA LESNPLLEQI DTHEEIDTRE 
TQDSETLDTA DALEQKEMPE ELPLDASWDT IYTAGTPSGT SGDYIDDELP VYQGETTQTL 
QDYLMWQVEL TPFSDTDRAI ATSIVDAVDD TGYLTVPLED ILESMGDEEI DIDEVEAVLK 
RIQRFDPVGV AAKDLRDCLL IQLSQFDKTT PWLEEARLII SDHLDLLANH DFRTLMRVTR 
LKEDVLKEAV NLIQSLDPRP GQSIQTGEPE YVIPDVLVRK HNGHWTVELN SDSIPRLQIN 
QHYASMCNNA RNDGDSQFIR SNLQDAKWLI KSLESRNDTL LRVSRCIVEQ QQAFFEQGEE 
YMKPMVLADI AQAVEMHEST ISRVTTQKYL HSPRGIFELK YFFSSHVNTE GGGEASSTAI 
RALVKKLIAA ENPAKPLSDS KLTSLLSEQG IMVARRTVAK YRESLSIPPS NQRKQLV