Gene Noca_3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3172
Symbol
ID	4600157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3370302
End bp	3371180
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	72%
IMG OID	639777778
Product	sigma-70 region 2 domain-containing protein
Protein accession	YP_924361
Protein GI	119717396
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02957] RNA polymerase sigma-70 factor, TIGR02957 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGG ACCCCTTCGT CGCTCACCGC AGCCTGCTGT TCACCGTCGC CTACGAGATG 
CTCGGGTCGG TCGCCGACGC CGAGGACGTG GTGCAGGAGA CCTGGCTGCG CTGGGCAGCC 
CTGCCCGCCG CCGACCGTGG TGAGGTCCGA GATCCCCGTG CCTACCTCGT GCGGATCGTC 
ACCCGGCTCT CCCTCAACCG GCTGCGTACG CTCACCCGGC TGCGGGAGGA GTACGTCGGC 
GAGTGGCTCC CCGAGCCGCT GCTCACCAGC CCCGACGTCG CCGAGGACGT CGAGCTCGCG 
GAGAGCGTGT CGATCGCCAT GCTCGCGGTC CTCGAGACAC TGCTGCCGAC CGAGCGTGCG 
GTCTTCGTGC TCCGGGAGGT CTTCGACGTG CCCTACGACG AGATCGCGGC GGCGTTGGAC 
AAGTCCTCCG CTGCGGTGCG CCAGATCGCG TCCCGGGCCC GCAAGTACGT GGCGGCCCGC 
CGGCCCCGGA CCTCGGTGAG CCGTGCGGAG CAGGAGCGGG TGGTCGAGCG GTTCCTCGCC 
GCCCTGACGA CCGGCGACGT CGTGGGACTG CTCGACGTGC TCGCTCCGGA CGTGCTCCTC 
GTGGGCGACG GCGGCGGCCT GGTCCCGACC GTCCCGAGTC CCGTGCGCGG GGCGGCCCGG 
CTCGCCCCGG TGATGGCCCG CTTCGCCGAG CTCGCGCCCG GCACGACGGC CGTCATCGTC 
GACCTCAACG GCGGCATCGC GGCGCGCATC GATCCCGGCG GCCAGAACGA CACGGCCGTC 
TCGTTCGTCA TCGAGGGCCA CCGGATCGCG CAGATCTACG CGATCCGCAA CCCCCACAAG 
CTCCAGCGCC TGGCAGAGGT GGCCGAGCTC CGACGGTGA

Protein sequence

MSEDPFVAHR SLLFTVAYEM LGSVADAEDV VQETWLRWAA LPAADRGEVR DPRAYLVRIV 
TRLSLNRLRT LTRLREEYVG EWLPEPLLTS PDVAEDVELA ESVSIAMLAV LETLLPTERA 
VFVLREVFDV PYDEIAAALD KSSAAVRQIA SRARKYVAAR RPRTSVSRAE QERVVERFLA 
ALTTGDVVGL LDVLAPDVLL VGDGGGLVPT VPSPVRGAAR LAPVMARFAE LAPGTTAVIV 
DLNGGIAARI DPGGQNDTAV SFVIEGHRIA QIYAIRNPHK LQRLAEVAEL RR