Gene Strop_4217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4217
Symbol
ID	5060701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4781730
End bp	4782971
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	72%
IMG OID	640476478
Product	sigma-70 region 2 domain-containing protein
Protein accession	YP_001161023
Protein GI	145596726
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.620791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGTCG CCACCGCCTA CGCCGACGAC TGGGGGCGGA TCGTTGCCAT GCTGATCCGG 
CTCGCCGGGG ACTGGGAGCT GGCGGAGGAG TGCGCCCAGG ACGCGTTCAC CGCGGCGCTC 
ACGCGCTGGC CGACGGAGGG GATACCGGAC CGTCCCGGGG GATGGCTCGC CACCACGGCC 
CGCAATCGCG CAGTGGATCG GCTTCGTCGC TCCGCCGTGG AGGCCGGGAA GCTGCGCGAC 
GTGTCCCGGC TGGGGGAGCC GGCCCCGGTC GGCTACTTTC CCGACGAACG CCTCGAGCTG 
ATGTTCACCT GCGTGCACCC GGCGCTTACC GGCGAGGCGC AGGTCGCGCT CATGCTGCGC 
TACCTCGCCG GGCTCCGGAC AGCGGAGATC GCCCGAGCTT TCCTGGTGTC GGAGCACACC 
ATGGGGCAAC GGCTGTTCCG TGCGAAGAGC AAGATCCGCC ATGCCGGGAT CCCGTTCCGG 
GTCCCGCCGG CCCAGCTGCT GCCGGAGCGA CTGTCGGCCG TGCTCTCGGT GCTCTATCTG 
CTGTTCAACG AGGGCTACGC GGCGACGGCC GGCTCGAACC TCGTGACGGC CGGTCTCTCC 
GCAGAGGCGA TCCGGCTGGC CCGACTCCTC ACCACCCTTA TGCCGGCTGA GCCCGAAGCC 
CGCGGACTAC TCGCGCTCAT GCTGCTGCAC GACGCCCGCC GCCCGTCCCG GGTCGACGAG 
CGTGGCGACC TCGTCACCCT GGCCGACCAG GACCGTTCGG CCTGGGACCA CCCCCAGATC 
GCCGAAGCGG TCGCCCTACT CGAGCAGGCA CTGGCCCAGC GCCGCCCCGG CGTCTACCAG 
GTGCAGGCGG CGATCGCTGC GGTCCACGCC GAGGCACCCG AGGCGGCGGC GACCGACTGG 
CCGCAGATCG TCGGACTGTA CGCGCAACTC GTCCGCCTGG CACCCACCCC GGTCGTCGAG 
CTCAATCGGG CGGTGGCGGT GGCGATGGCC GACGGGCCCG GAGCCGGACT GGCATTGGTG 
GATCGCCTGG CCGCCACTGG AGTGCTCAAC GACTACTACC TGCTGCCGGC GACCCGGGCC 
GACCTGCTGC GTCGGCTGGG GCGACACGCC GAGGCGGCGG CCGCCTACCG TCGGGCGCTC 
GATCTGTGCG GGACCGACGC CGAGCACCGA TACCTGCTCC GGCGCCTGTG CGAGGTGTCG 
GCACCCACCT CGTGGGAAAG CCGTCCAGGG TCGGCCAGAT AG

Protein sequence

MAVATAYADD WGRIVAMLIR LAGDWELAEE CAQDAFTAAL TRWPTEGIPD RPGGWLATTA 
RNRAVDRLRR SAVEAGKLRD VSRLGEPAPV GYFPDERLEL MFTCVHPALT GEAQVALMLR 
YLAGLRTAEI ARAFLVSEHT MGQRLFRAKS KIRHAGIPFR VPPAQLLPER LSAVLSVLYL 
LFNEGYAATA GSNLVTAGLS AEAIRLARLL TTLMPAEPEA RGLLALMLLH DARRPSRVDE 
RGDLVTLADQ DRSAWDHPQI AEAVALLEQA LAQRRPGVYQ VQAAIAAVHA EAPEAAATDW 
PQIVGLYAQL VRLAPTPVVE LNRAVAVAMA DGPGAGLALV DRLAATGVLN DYYLLPATRA 
DLLRRLGRHA EAAAAYRRAL DLCGTDAEHR YLLRRLCEVS APTSWESRPG SAR