Gene Noca_3875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3875
Symbol
ID	4598010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4092849
End bp	4093865
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	67%
IMG OID	639778481
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_925060
Protein GI	119718095
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.372759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCATCG CACAGCGCCC CACCCTGTCG GAAGAGACCG TCGACGAGTT CCGCTCGCGG 
TTCGTGATCG AGCCCCTGGA GCCCGGCTTC GGCTACACGC TGGGCAACTC GCTCCGCCGT 
ACCCTCCTCA GCTCGATCCC GGGTGCCTCG GTCACGAGCA TCAAGATCGA CAACGTCCTC 
CACGAGTTCT CCACCATCGA GGGGGTCAAG GAGGACGTCA CGGAGGTCAT CCTCAACCTC 
AAGGGTCTCG TCGTCTCCTC GGAGCACGAC GAGCCCGTCA CCATGTACCT GCGCAAGTCG 
GGTGCCGGTG ACGTGACCGC CGCCGACATC GCGCCGCCGG CCGGTGTCGA GGTGCACAAC 
CCCGACCTGA AGATCGCGAC CCTGTCCGAC AAGGGCAAGC TGGAGATGGA GCTGGTCGTC 
GAGCGTGGCC GTGGCTACGT CTCCGCCGTC CAGAACAAGG GCGCCGACAA CGAGATCGGC 
CGGATGCCGG TCGACTCGAT CTACAGCCCG GTCCTCAAGG TGACCTACAA GGTCGAGGCC 
ACCCGTGTCG AGCAGCGCAC CGACTTCGAC AAGCTCGTCA TCGACGTCGA GACCAAGCCG 
TCGATCCGGC CCCGCGACGC GATCGCGTCG GCCGGCAAGA CCCTGGTCGA GCTCTTCGGC 
CTGGCCCGCG AGCTGAACGT CGAGGCCGAG GGCATCGACA TCGGCCCGTC GCCGGTCGAC 
GAGCAGCTGG CCGCGGACCT CGCCCTCCCG GTCGAGGACC TGCAGTTGAC CGTCCGCTCC 
TACAACTGCC TCAAGCGCGA GGGCATCCAC ACCGTGGGTG AGCTCATCAG CCGCTCGGAG 
CAGGACCTGC TCGACATCCG CAACTTCGGT GCGAAGTCGA TCGACGAGGT CAAGGCCAAG 
CTGGTCGAGA TGGGCCTGTC CCTCAAGGAC AGCGCGCCCG GCTTCGACCC GCACGCCGCG 
CTCGCGGCGT ACGGCGATGA CGACGACGAC GCGTTCGTCG AAGACGAGCA GTACTGA

Protein sequence

MLIAQRPTLS EETVDEFRSR FVIEPLEPGF GYTLGNSLRR TLLSSIPGAS VTSIKIDNVL 
HEFSTIEGVK EDVTEVILNL KGLVVSSEHD EPVTMYLRKS GAGDVTAADI APPAGVEVHN 
PDLKIATLSD KGKLEMELVV ERGRGYVSAV QNKGADNEIG RMPVDSIYSP VLKVTYKVEA 
TRVEQRTDFD KLVIDVETKP SIRPRDAIAS AGKTLVELFG LARELNVEAE GIDIGPSPVD 
EQLAADLALP VEDLQLTVRS YNCLKREGIH TVGELISRSE QDLLDIRNFG AKSIDEVKAK 
LVEMGLSLKD SAPGFDPHAA LAAYGDDDDD AFVEDEQY