Gene MCA0741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0741
Symbol	rpoN
ID	3103530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	780492
End bp	781955
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	60%
IMG OID	637169945
Product	RNA polymerase factor sigma-54
Protein accession	YP_113244
Protein GI	53805053
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.111429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAT CACTGCAACT TCGGCTGGGG CAGCAACTGG CCATGACCCC CCAGCTGCAG 
CAGGCCATCA AGCTGCTGCA GATGTCCACG CTCGAATTGC AACAGGAAAT CCAGCAGGCC 
CTGGATTCCA ACATGATGCT GGAAATCACC GACGAGGAAG AGCCCGTCCT GAACGCTGTG 
ACCGAGGAGC CGCCGCTTGC CGCTGCCGAA CCCGCCTACG CCGAGCTCCC CGATCTCGAC 
ACCCAGACCA CCATCCCCGA CGAACTGCCG GTCGACTCCT CCTGGGAGGA CGTTTTCGAC 
GGCATGCACA ATTACACGCC CAGCAACGCG GCAGAGCCGG AGAACGAAGA TTTCCTGGGG 
CAGCGGGGCA AGGGACAAAG TCTCCAGGAT TACCTGCTCT GGCAGATGGA GCTCACCCCC 
TTCACCGAGC GCGACCATGC GATCGCAACC GCCATCATCG ATGCGGTGGA CGATGACGGC 
TATCTGGATG CCACCGTGGA AGAGATCACC CAGGGGCTGA GCTCGCAACT CGAAAACCTC 
GAACAGGACG AAGTCCGGGC GGTTCTGCAC CGCATCCAAA ACTTCGATCC ACCCGGCATC 
GCTGCGGAAA ACCCGGCCGA CTGCCTGCGC ATCCAACTGC AGCAGATGCC CGAGAACACC 
CCCTACCGCG CCCAGGCCCT CGAGCTGGTC CGCCATCACG TCGACCTGCT CGCGAAGAAG 
GATCTCGTCA GGCTCAAGAA AGCGCTGGAG CTCGACGACG ATGAGCTGGC CGAAGTGATC 
CGTCTGGTCC GGTCCCTCGA CCCGAAACCG GGCCGCGCGG TGGAACCGGA CGACTACCAG 
TACATCATCC CGGACGTCTT CGTCTATCGG CAGGGAACCG AATGGGCCGT CGCCCTCAAC 
CCTGAAATCG CTCCCAGACT GCGCGTCAAC CCCTATTACA GCGGCCTGAT TCGGCGAGCG 
GACAGCAGCT CCGACAACGT GACCATGCGC AATCATCTGC AGGAAGCGCG CTGGTTCATC 
AAGAGCCTGC AGAGCCGCAA CGAAACCCTG CTCAAAGTGG CGCGCGCCAT CGTAGACCGC 
CAGCGCGAGT TTCTCGAGAT TGGTGAAACC GCGATGAAAC CCCTGGTGCT GCGTGACATT 
GCCGAAGAAG TCTCCATGCA CGAATCGACG ATTTCGCGGG TAACGACCCA GAAATACATG 
CACACGCCCA ATGGCATCTA CGAATTCAAG TATTTCTTTT CGAGCCACGT GTCCACGGAT 
TCCGGCGGCG AATGCTCGGC CACTGCAATC AAGGCGTTCC TCAAGGAAAT CGTGAGCAAG 
GAAGACGCGA CCCGTCCCTT GAGCGACCAT GCCATCGCCG GCATGCTGAA AGACAAGGGC 
ATCAACGTTG CGCGGCGAAC CATCGCCAAA TACCGTGAAG CGATGGGCAT TCCACCGTCC 
AACGAAAGAA AGCAGTTGTT CTAA

Protein sequence

MKQSLQLRLG QQLAMTPQLQ QAIKLLQMST LELQQEIQQA LDSNMMLEIT DEEEPVLNAV 
TEEPPLAAAE PAYAELPDLD TQTTIPDELP VDSSWEDVFD GMHNYTPSNA AEPENEDFLG 
QRGKGQSLQD YLLWQMELTP FTERDHAIAT AIIDAVDDDG YLDATVEEIT QGLSSQLENL 
EQDEVRAVLH RIQNFDPPGI AAENPADCLR IQLQQMPENT PYRAQALELV RHHVDLLAKK 
DLVRLKKALE LDDDELAEVI RLVRSLDPKP GRAVEPDDYQ YIIPDVFVYR QGTEWAVALN 
PEIAPRLRVN PYYSGLIRRA DSSSDNVTMR NHLQEARWFI KSLQSRNETL LKVARAIVDR 
QREFLEIGET AMKPLVLRDI AEEVSMHEST ISRVTTQKYM HTPNGIYEFK YFFSSHVSTD 
SGGECSATAI KAFLKEIVSK EDATRPLSDH AIAGMLKDKG INVARRTIAK YREAMGIPPS 
NERKQLF