Gene Strop_3895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3895
Symbol
ID	5060373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4457180
End bp	4458244
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	66%
IMG OID	640476152
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001160703
Protein GI	145596406
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCGTCA TATGGCGGGC GCCCCGGAAG AAAAGAGAAG AGATGCTCAT CTCCCAGCGA 
CCCTCGCTCT CCGAGGAGTC GATCAACGAG ACCCGGTCCC GGTTCACCAT CGAGCCGCTG 
GAGCCCGGCT TCGGCTACAC CCTGGGTAAC TCGCTGCGCC GGACGCTGCT GTCGTCCATT 
CCCGGCGCGG CGGTGACCTC GATCAAGATC GATGGTGTGC TGCACGAGTT CACCACGATC 
CCCGGGGTCA AGGAGGATGT GGTCGAGCTC GTCATGAACA TCAAGGAGCT CTGCGTCAGC 
TCCGAGCACG ACGAGCCGGT CAGCATGTAC CTGCGCAAGC AGGGCCCGGG TGACGTGACC 
GCGGGTGACA TCCAGCCCCC GGCTGGCGTC TCGGTGCACA ACCCGGACCT GAAGCTCGCC 
ACCCTCAACG GCAAGGGCCG GCTCGACATG GAGCTGACCG TCGAGCGGGG CCGTGGCTAC 
GTCACCGCGG CGCAGAACAA GCAGGCGGGT GCCGAGATCG GTCGGATCCC GGTCGACTCG 
ATCTACTCGC CGGTGCTCCG GGTGACCTAC CGGGTCGAGG CGACCCGGGT CGAGCAGCGG 
ACCGACTTCG ATCGGCTGAT CATTGACGTC GAGTCCAAGC CGTCGATGGG GCCCCGTACG 
GCCCTGGCCT CGGCCGGTTC CACGCTGGTC GAGCTCTTTG GCCTGGCCCG GGAGCTGGAC 
GAGACCGCAG AGGGCATCGA CATCGGGCCG TCCCCGCAGG ACGCCCAGCT GGCAGCGGAT 
CTGGCGCTGC CGATCGAGGA GCTGGACCTC ACCGTCCGCT CCTACAACTG CCTCAAGCGC 
GAGGGCATCA ACACCGTTGG TGAGCTCATT GGGCGTACCG AGGCTGACCT CCTCGACATC 
CGTAACTTCG GCCAGAAGTC GATCGACGAG GTCAAGATGA AGCTCGCTGG GATGGGCTTG 
GGGCTGAAGG ACTCGGCCCC GAACTTCGAC CCGGCGAACG TCGTGGACGC CTTCGGCGAG 
GCCGACTACG ACACCGAGGA CTACCGCGAG ACTGAGCAGC TGTAA

Protein sequence

MGVIWRAPRK KREEMLISQR PSLSEESINE TRSRFTIEPL EPGFGYTLGN SLRRTLLSSI 
PGAAVTSIKI DGVLHEFTTI PGVKEDVVEL VMNIKELCVS SEHDEPVSMY LRKQGPGDVT 
AGDIQPPAGV SVHNPDLKLA TLNGKGRLDM ELTVERGRGY VTAAQNKQAG AEIGRIPVDS 
IYSPVLRVTY RVEATRVEQR TDFDRLIIDV ESKPSMGPRT ALASAGSTLV ELFGLARELD 
ETAEGIDIGP SPQDAQLAAD LALPIEELDL TVRSYNCLKR EGINTVGELI GRTEADLLDI 
RNFGQKSIDE VKMKLAGMGL GLKDSAPNFD PANVVDAFGE ADYDTEDYRE TEQL