Gene Noca_3869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3869
Symbol
ID	4598004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4088066
End bp	4089199
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	76%
IMG OID	639778475
Product	sigma-70 region 2 domain-containing protein
Protein accession	YP_925054
Protein GI	119718089
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGGAGC TGGTCCGGGA GCTGGTGCCC CAGGTCCTCG GTGTCCTCGT CCGTCGCGGA 
GCCGACTTCG CGTCGGCCGA GGACGCCGTC CAGGAGGCGC TCGTCGAGGC GGTACGCCGC 
TGGCCGGACG CGCCGCCGGA CGACCCGAAG GCATGGCTGG TCACGGTGGC CTGGCGCAAG 
GTCGTCGACG CCGGGCGCTC CGAGTCGGCG CGCCGGGCCC GCGAGGAGCG CGTGCACGAG 
GAGCCGGCGC CGGGACCCGC GGCGGGGCAG GACGACACCC TGCTGCTGCT GTTCCTGTGC 
TGCCACCCCG CGCTCAGCCC GTCCTCGGCG GTCGCGCTCA CGCTGCGCGC GGTCGGCGGG 
CTGACCACCC GGCAGATCGC CGCGGCGTAC CTCGTGCCGG AGGCGACGAT GGCCCAGCGG 
ATCAGCCGGG CGAAGCGCAC GGTCGCCGAC GCCGGCGTCG GCGCACCCGG TGACCTGCGG 
CGGGTGCTGA CCGTGCTGTA CGTGGTGTTC AACGAGGGCT ACTCCGGCGA CGTCGACCTC 
GCGGCCGAGG CGATCCGCCT GACCCGGATG CTCGCCGAGG CGAGCGACGA GCCCGAGGTC 
GCCGGCCTGC TCGCGCTGAT GCTGCTCCAC CACGCCCGCC GCGCCGCCCG CTGGACCGAG 
CAGGGCGCGC TGGTGCCGCT CGCCGAGCAG GACCGCAGCC GCTGGGACAC CGCGCTGGTC 
GCCGAGGGGG TCGAGATCCT GCAGGCCGCG CTCGCCCGCG ACCGGCTCGG GGAGTACCAG 
GCCCAGGCCG CGATCGCCGC CCTGCACTGC GACGCCCGCT CGACGGAGGA GACCGACTGG 
CCGCAGGTCC TGGAGTGGTA CGACGAGCTG CTCGGCCTCA CCGACTCACC CGTGGTCGCC 
CTCAACCGGG TGGTCGCGGT CGGCGAGGTC GACGGACCCT TGGTCGGCCT CCGCGAGCTG 
GCGTCGGTGC CGGCGGACGT GCCGCGTCGT ACCGCCGTCG AGGCGTGGCT GCACGAGCGC 
GCCGGCGACA CCGCCCTCGC GGGCCGGCTC TACGCGGCGG CCGCGGCCGC CGCGAGCAGC 
GCCGTCGAGC GCGACCACCT CACCCGACAG GCGGCTCGGC TGCGGCACGA CTGA

Protein sequence

MEELVRELVP QVLGVLVRRG ADFASAEDAV QEALVEAVRR WPDAPPDDPK AWLVTVAWRK 
VVDAGRSESA RRAREERVHE EPAPGPAAGQ DDTLLLLFLC CHPALSPSSA VALTLRAVGG 
LTTRQIAAAY LVPEATMAQR ISRAKRTVAD AGVGAPGDLR RVLTVLYVVF NEGYSGDVDL 
AAEAIRLTRM LAEASDEPEV AGLLALMLLH HARRAARWTE QGALVPLAEQ DRSRWDTALV 
AEGVEILQAA LARDRLGEYQ AQAAIAALHC DARSTEETDW PQVLEWYDEL LGLTDSPVVA 
LNRVVAVGEV DGPLVGLREL ASVPADVPRR TAVEAWLHER AGDTALAGRL YAAAAAAASS 
AVERDHLTRQ AARLRHD