Gene Noca_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2117
Symbol
ID	4599961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2262345
End bp	2263613
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	75%
IMG OID	639776720
Product	sigma-70 region 2 domain-containing protein
Protein accession	YP_923313
Protein GI	119716348
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGGGA GCAGTGGAGG GAGCAGCGCA GCGACAGGGG AGGCGATCAC CGCCGCGTGG 
CGTGCGGAGT CCGCGCGCCT GGTCGGTGCG CTGACCCGGA TGACGCGGGA CCTCGGCCTC 
GCCGAGGACC TGGCCCAGGA CGCGCTGGTG AGCGCGTTGG AGCAGTGGCC GTCCCGCGGC 
ATCCCCGCCA ACCCGGCGGC GTGGCTGATG ACCACGGCGA AGCGCCGCGC CGTCGACGGG 
TTCCGGCGGG CCGAGACCTT GCGCCGCAAG ACCGAGGAGC TCGGTCACGG CCTGAGCGAG 
GAGGACGCGA TGCCGGACCT CAGCGCGCAG GTGGACTTCA TCGAGGACGA CGTCCTCCGG 
CTGATCTTCC TGTCCTGCCA CCCACGGCTG ACCCCGGAGT CGCGGGCCGC CCTGACGCTC 
CGCCTGGTCG GCGGACTGTC GACCGCGGAG ATCGCCCGTG GCTTCCTGGC TGCCGAGTCG 
GCGATCGGCC AGCGCATCTC GCGCGCCAAG AGGACGCTCA GCGAGGTGCG TGCCGAGTTC 
GAGCTCCCGG TGGGTGCCGA ACGCACCGCC CGGCTCGAGG ACGTGATGGC CGTCGTCTAC 
CTGATCTTCA ACGAGGGCTA CACCGCCACG GCGGGCGAGG ACTGGATGCG CCCCGAGCTG 
ACCGGCGAGG CGATCAGGCT GGCGCGGATG CTGGCCGAGC TGATGCCGGA CGAGCCCGAG 
GCGCACGGGT TGCAGGCGCT GCTGGAGCTG CAGGCCTCCC GGGGGCCGGC GCGGGTCGAC 
GCCGAGGGCC GGCCGGTGCT CCTCGACGAC CAGGACCGCA GCAGCTGGGA CGCCCTGCTC 
ATCCGTCGGG GGCTGGCCGC GCTGGAGCGC GCCGAGGTGC TCGCCCGCGG CGGAGCCCCG 
GTCGGCCGGT ACTACCTGCA GGCCGCGATC GCGGCGCAGC ACGCCCGGGC GGCGAGCAGC 
GAGCACACCG ACTGGCGGGC GATCGCGGCG CTGTACGACG TGCTCGCCGA GGCCGCGCCC 
GGCCCGGTGG TGGAGGTCAA CCGCGCGGTC GCCCACGGGC GGGCCTTCGG TCCGGCCGCC 
GGGCTCGCCG TACTCGATGG CCTGCCGGAG GGTGCGCTCG CCGGATCGCA CCTGCTGCCC 
AGCGTGCGTG GCGACCTGCT CGCGCGGGCG GGACGCCACC CCGAGGCGGC TGCATCGTTC 
CGCGAGGCAG CCTCGCTCAC CCGCAACGAG AGCGAGCGGG CGCTGCTACT GCGCCGGGCA 
GAGGAGTGA

Protein sequence

MAGSSGGSSA ATGEAITAAW RAESARLVGA LTRMTRDLGL AEDLAQDALV SALEQWPSRG 
IPANPAAWLM TTAKRRAVDG FRRAETLRRK TEELGHGLSE EDAMPDLSAQ VDFIEDDVLR 
LIFLSCHPRL TPESRAALTL RLVGGLSTAE IARGFLAAES AIGQRISRAK RTLSEVRAEF 
ELPVGAERTA RLEDVMAVVY LIFNEGYTAT AGEDWMRPEL TGEAIRLARM LAELMPDEPE 
AHGLQALLEL QASRGPARVD AEGRPVLLDD QDRSSWDALL IRRGLAALER AEVLARGGAP 
VGRYYLQAAI AAQHARAASS EHTDWRAIAA LYDVLAEAAP GPVVEVNRAV AHGRAFGPAA 
GLAVLDGLPE GALAGSHLLP SVRGDLLARA GRHPEAAASF REAASLTRNE SERALLLRRA 
EE