Gene Noca_2278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2278
Symbol
ID	4597824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2426863
End bp	2428284
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	66%
IMG OID	639776877
Product	sigma-70 region 4 domain-containing protein
Protein accession	YP_923470
Protein GI	119716505
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCTCGC CTCGATCGGC GGATGACTCG GCCCAGGATG AGCGCAGCCG CGCGGGCGCG 
CCCAGCGCTG GCGGCTGTGC CGAGACGGTC GATGACCTGG GCGACGGGGA CCTCGGCGCT 
CGCGGGTGGC TCGATGACGC TTGGGTGGCT CTCCCTGAAC GCAGCCGAGA CATCCTCCGT 
CGGCGCCTCG CTGGGGAGAC ACTGGATGAG ATTGGACTGG CTCTGAACCT CACCCGCGAA 
CGCGTCCGGC AGGTACAGAA GGCGTCTGAA GGCGCGCTCG TGCGCGCGAT GGAAAATCGG 
GCCCCGCAGT TTCTCTCCGC CTTGCACACG GAACTCGGCG ACTCCCCGGC GGTGGCGCAT 
CGTCACCTCG CGAAGCTTGT GGACGCTCAC TCCACGACCG CGCTGGGGTG TTTGCTCAAG 
ACCTTGGGTG CCAGCCATCC CCGCACCTGG GCTGGGGCGC TCTCCGAGTT CTGGACCTTT 
CGGCCGAACG AGCTGCGACA ACAATTGGGC CGAATGGTCG AGCTCGCACC CCTGACCCAC 
GAGGAAGCTG ACCAAGCCGC CGCCGGGCTT GGCCTTCCCG AGGACCTCGA TTGGCGAAGC 
GTTCTCGCGC ACAGAAACAG CAAACTGGCC GCCCACGATC TGGGTTGGAT TCGACCCGCG 
CGACTCACCC GAGACGTGGC GTATCTCTGG CTCAAGCTCG AGGGCGAACC ACGAGCTGCG 
GACGAGATCG CGGTACAGGC AGGATGCAGT GAACATGCCG CGCGGGAGAA CATGCGACGA 
GACCCAGCCT TCTCACAAGT TCGACCAGAG GGCACTTGGG CGCTCTCCGA TTGGCGTGTC 
CCCGGCTCAG AGAACCGCTA TGGCTCCGCC GTTGACGCCC TGGTTGAGGT TCTCCGAGAT 
CTCGGGCCGC TGCCTGTTGA CCAACTCCGC GTTGAGACAC AGCGCCGTTA CCCCGTCAGT 
GATTGGCGGG TGAACCAGTG CCTGTCGAGC AACCTCATCG GGCTTAACCC CGCTGGCCTG 
TATGACCTGG CCGAACGGGG GGCTGTCCCC GTCGAGGACA CGGAACCCAA GCAGCCTCCG 
AACATCAAGA CCAGTGGAGA CGTGGTGGGC ATCGAACTCG TAGTCGACCG CGAGATCCTT 
CGCGGCAGCG GTATACCCGT GAATCGCTGG CTCACTTGGC AGCTGGGCCT CAGAACCGCT 
CCGTCGACAA GATACTTTGC CCTCCCGGAG GGACACGGCG AGGTGCGCGT CACGCGGATG 
ACCAGCAATG CTCAAGTCTC GAGTTTGCGT GCGGTGGCCG CCGAGTTCGG CCTCGTTGAG 
GGCTGCAAGT TTGCGCTCCT GCTCAACACG AGCACGGACA CCGCCAGCGT CCGCCACATC 
TGCCCGCAGG ACGCGTGTGG CGCGCGTAGC GCGACGCACT GA

Protein sequence

MFSPRSADDS AQDERSRAGA PSAGGCAETV DDLGDGDLGA RGWLDDAWVA LPERSRDILR 
RRLAGETLDE IGLALNLTRE RVRQVQKASE GALVRAMENR APQFLSALHT ELGDSPAVAH 
RHLAKLVDAH STTALGCLLK TLGASHPRTW AGALSEFWTF RPNELRQQLG RMVELAPLTH 
EEADQAAAGL GLPEDLDWRS VLAHRNSKLA AHDLGWIRPA RLTRDVAYLW LKLEGEPRAA 
DEIAVQAGCS EHAARENMRR DPAFSQVRPE GTWALSDWRV PGSENRYGSA VDALVEVLRD 
LGPLPVDQLR VETQRRYPVS DWRVNQCLSS NLIGLNPAGL YDLAERGAVP VEDTEPKQPP 
NIKTSGDVVG IELVVDREIL RGSGIPVNRW LTWQLGLRTA PSTRYFALPE GHGEVRVTRM 
TSNAQVSSLR AVAAEFGLVE GCKFALLLNT STDTASVRHI CPQDACGARS ATH