Gene Noc_2300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2300
Symbol
ID	3704506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2651873
End bp	2652871
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	44%
IMG OID	637738779
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_344288
Protein GI	77165763
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.626083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGTAT CTAATTTTCT TAAGCCCAGG ATAGTGGATG TCCAGCGTAT AAATGATTAC 
GCAACTAAGG TTACTTTAGA ACCGCTAGAA CGCGGATTCG GGCATACCTT GGGCAATGCT 
CTGCGCCGAA TCTTACTATC TTCAATGCCA GGCTGTGCCA TTATCGAAGC GCAAATTGAT 
GGTGTGTTAC ATGAATATAC CACCAAGGAA GGGGTGCAGG AGGATATGAC GGAAATCCTG 
CTTAATCTTA AAGGAGTTGC AGTCAAGTTG CATGGCCGTG ATGAAGTCAC CTTGAATTTG 
AGCAGTAAAG GGCCGGTAAC GGTGACTGCG GGAGATATTC AACTGGAGCA TGATGTAGAG 
GTTATTAATC CTGAGCACGT TATTGCTCAT CTCACTAAAT CTGGTGAACT TAACCTTACT 
ATGAAGGTTG TCCGTGGCCG AGGTTATCAG TCAGCTTCCA TGCGAATTCC TAAGGAAGAG 
GATGAACGCT CTATCGGGCA CCTAATTCTT GATGCTTCGT TTAGCCCTAT CCGAAGAGTG 
ACTTATGAAG TAGATAGTGC CCGCGTTGAG CAGCGAACCG ATTTAGATAA GCTGATTATA 
GAGATCGAAA CGAATGGTAC TATCGCCCCG GATGAAGCAG TACGAAAGGC TGCAACCATT 
CTGCAAGATC AGCTAACGGC TTTTGTTGAG TTGGAAGGTA AAATTGAAAC GGCTAAAGAG 
AAAAAGGCGG CCGAGATTGA TCCTGTGCTA TTACAGCCGA TAGACGATCT GGAATTGACG 
GTACGTTCAG CAAATTGTCT TAAAGCAGAA AATATTTACT ATATTGGCGA TCTTATTCAG 
AAAACGGAGG TTGAGTTATT AAAAACTCCT AATTTGGGTA AGAAATCGCT AACGGAAATT 
AAAGATGTAT TGACATTGCG GGGGCTATCT TTAGGTATGC GCTTAGAAAA TTGGCCGCCG 
GCGGGGCTAC GTGAAGAAGA AACTAAAGTT ACTGCTTGA

Protein sequence

MQVSNFLKPR IVDVQRINDY ATKVTLEPLE RGFGHTLGNA LRRILLSSMP GCAIIEAQID 
GVLHEYTTKE GVQEDMTEIL LNLKGVAVKL HGRDEVTLNL SSKGPVTVTA GDIQLEHDVE 
VINPEHVIAH LTKSGELNLT MKVVRGRGYQ SASMRIPKEE DERSIGHLIL DASFSPIRRV 
TYEVDSARVE QRTDLDKLII EIETNGTIAP DEAVRKAATI LQDQLTAFVE LEGKIETAKE 
KKAAEIDPVL LQPIDDLELT VRSANCLKAE NIYYIGDLIQ KTEVELLKTP NLGKKSLTEI 
KDVLTLRGLS LGMRLENWPP AGLREEETKV TA