Gene Strop_4402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4402
Symbol
ID	5060888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4979791
End bp	4980936
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	73%
IMG OID	640476665
Product	sigma-70 region 2 domain-containing protein
Protein accession	YP_001161208
Protein GI	145596911
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.270648
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.805777
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATGGGG AACAGCTGCG GGACCTCGTA CCAGCGGTGA TCGGCATCCT CGTCCGGCGC 
GGTGCGGATT TCGCGTCGGC CGAGGATGCC GTGCAGGACG CCCTGGTCGA GGCGGTGCGC 
GGCTGGCCGG ACAGTCCGCC GCAGGACCCC AGAGGCTGGT TGATCACCGT GGCCTGGCGC 
AAGTTCCTCG ACGCGGCCCG CGCCGACACC TCCCGGCGCC GGCGCGAGGT ACGCGTCGAG 
GGCGAGCCCG CACCGGGGCC GGTCGAGGCG GTGGACGACA CGCTTCAGCT GTACTTCTTG 
TGCGCTCACC CCTGTCTGAC ACCGGCCTCG TCCGTCGCGC TCACGCTGCG CGCGGTCGGC 
GGCCTGACCA CGCGTCAGAT CGCGCGGGCC TACCTCGTGC CGGAGGCGAC CATGGCCCAG 
CGGATCAGCC GGGCCAAGCG TACGGTCTCG GGTGTCCGCC TCAACCAGCC CGGTGATGTC 
GCCACGGTGG TGCGCGTGCT CTATCTGGTC TTCAATGAGG GCTACTCCGG GGATGTCGAC 
CTTGCCGCCG AAGCGATCCG GCTCACTCGT CAACTCGCTG CCAAGATTAG CCACGAGGAG 
GTCGCAGGCC TGCTGGCGCT GATGCTGCTG CACCACGCGC GACGGCCGGC GCGCACCGAC 
TCCGACGGCC GGCTCGTGCC TCTTGCCGAG CAGGACCGCA GCCGGTGGAA CCGCCACCTG 
ATCGCTGAGG GCGTCGAGCT GCTCCAGAAA GCCCTCGCCC GGGACCGGCT GGGAGAGTTC 
CAGGCCCAGG CCGCCATCGC CGCACTGCAC GCCGACGCCC GGACGGTCGA GGAGACCGAC 
TGGGTGCAGA TCGTCGAGTG GTACGACGAC CTGGTGCGCC TGACCGACAG CCCGGTGGTT 
CGCCTTAACC GGGCGGTCGC CCTCGGGGAG GCCGACGGCC CGAGGGCCGG CCTGGCGGCC 
CTGGCCGGGC TCGACCCCGC CCTGCCCCGG CACACCGCCG TCGCGGCCTA CCTGCACGAG 
CGGGCGGGCG ACCCGGTGAC CGCGGCCCGG CTCTACGCCG AGGCCGCCCG CTCGGCACCG 
AGCCTCCCCG AGCGCGACCA CCTCATCCGA CAGGCCGCCC GACTCAACTC GCCACCGCGT 
CGTTGA

Protein sequence

MNGEQLRDLV PAVIGILVRR GADFASAEDA VQDALVEAVR GWPDSPPQDP RGWLITVAWR 
KFLDAARADT SRRRREVRVE GEPAPGPVEA VDDTLQLYFL CAHPCLTPAS SVALTLRAVG 
GLTTRQIARA YLVPEATMAQ RISRAKRTVS GVRLNQPGDV ATVVRVLYLV FNEGYSGDVD 
LAAEAIRLTR QLAAKISHEE VAGLLALMLL HHARRPARTD SDGRLVPLAE QDRSRWNRHL 
IAEGVELLQK ALARDRLGEF QAQAAIAALH ADARTVEETD WVQIVEWYDD LVRLTDSPVV 
RLNRAVALGE ADGPRAGLAA LAGLDPALPR HTAVAAYLHE RAGDPVTAAR LYAEAARSAP 
SLPERDHLIR QAARLNSPPR R