Gene Strop_4105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4105
Symbol
ID	5060587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	4668299
End bp	4670395
Gene Length	2097 bp
Protein Length	698 aa
Translation table	11
GC content	70%
IMG OID	640476366
Product	oligopeptidase B
Protein accession	YP_001160913
Protein GI	145596616
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1770] Protease II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.662092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCATCG AGACCCCAGC GCCCGTCGCC AAACGGATGC CGACCGAGCG AACCCACCAC 
GGCGATACGT TCACTGACGA GTACGCCTGG CTCGCCGGCA AGGACGATCC CGCCACGATT 
GCCTACCTCA CCACCGAGAA CGCCTACACC GAGGCGCGGA CGGCCCACCT GGCGGACCTG 
CGCGAGCAGC TGTTCGAGGA GATCCGCCAG CGGACCCAGG AGACCGACCT GTCGGTGCCC 
GCCCGCAAGG GCGGCCACTG GTACTACACC CGCACGGTCG AGGGGCAGCA GTACGGAGTG 
CAGTGCCGCC GCGCCGTCCA CGACGGCGAG ACCGACCCGC CGGTCAGCCA GGACGGTGCC 
CCCCTCGCGG ACGAGGAGGT ACTGCTCGAT GGCAACGTCC TCGCCGCGGG GCACGACTTC 
TTCGCGCTCG GGGCGTTCGA CGTGAGCCCG GACGGACGCT GGCTGGCGTA CTCGACCGAC 
TTCTCCGGCG ACGAGCGGTT CACGCTCCGG GTCAAGGACC TCACCACCGG GGAACTGCTG 
CCCGACGAGG TGCCCGGCAC GTTCTACGGA ACGGCCTGGT CCGCCGACGC CTCGGTGCTC 
TTCTACGTCA CGGTTGACGA CGCGTGGCGG CCGAACCGGG TCTGGCGGCA CACCCTGGGC 
ACCTCGGCCA GCGAGGACGT GGTGGTTTAC CAGGAGGACG ACGAGCGGTT CTGGGTCGGG 
GTCGAGCTGA CCCGCTCGGA GAAGTTCCTC CTCATCGACA TTCACAGCAA GGTGACCAGC 
GAAGTCCTGG CCATCCCCGC CGGCAACCCG ACCGGCGCCC CGGTTCCGGT GGCCCCCCGC 
CGCCAGGGTG TGGAGTACAC GGTCGAGCAC CACGGCCACC GGTTCCTGAT CCTGCACAAC 
GACGGCGCCG AGGACTTCGC CCTCGCGTAC ACCTCGGCCG ACGCCCCGGG CGACTGGGTG 
CCGCTCATCG AGCACCGTCC CGGCACCCGT CTGGAGGCGG TCGACGCCTT CGAGAACCAT 
CTGGTGGTCA CGTTGCGCGC CAACGGGCTG ACCGGGCTGC GGGTGCTGCC GATCGGGGGT 
GGCGACTCAC ACGACATCGA CTTCCCCGAA CCGCTGTACA GCGTCGGCCT GGACAGCAAC 
CCGGAGTACC GCACGGGTCA GCTCCGATTC CGCTACACCT CACTGGTCAC CCCGGACTCG 
GTGTACGACT ACGACCTGGT CACCCGCCGG ATGATTCAAC GCCGGCAGCG GCCGGTGCTG 
CCCGGGCCGG ACGGCCGCCC GTACGACCCC GCCGGCTACG AGCAGCACCG GGACTGGGCG 
ATCGCCGACG ACGGCACCCG GGTGCCGATC TCGCTGGTCT GCCGGGCCGG CACCCCGCGC 
GACGGCTCCG CGCCGTGCGT CATCTACGGC TACGGCTCCT ACGAGGCGAG CATGGACCCC 
TGGTTCTCGG TCGCCCGGCT CTCCCTGCTG GACCGGGGTG TCGTCTTCGC CGTGGCACAC 
ATCCGCGGCG GCGGCGAGCT GGGCCGGCGC TGGTATGACC AGGGCAAGCT GCTGGCCAAG 
AAGAACACCT TCACCGACTT CGTGGCCTGC GCACGGCACC TGGTCGAGGC GGGTTGGACC 
GCGACCGACC GGCTGGTCGC CCGGGGCGCC TCCGCCGGCG GGCTGCTGAT GGGGGCGGTC 
GCCAACCTCG CCCCGGACGC GTTCACCGGG ATCGTCGCGC AGGTTCCCTT CGTCGACGCG 
CTGACCTCGA TGCTCGACCC GTCGCTGCCG TTGACCGTCA CCGAGTGGGA GGAGTGGGGC 
AACCCGCTGG ACGACCCCGA GGTGTACGCG TACATGAGGT CGTACACGCC GTACGAGAAC 
GTGCGGGCCG TGGACTATCC AGCGATCCTC GCGGTGACCA GCCTCAACGA CACCCGGGTG 
CTCTACCACG AGCCGGCGAA GTGGATCGCG CGACTGCGAG CCACCGCACC GCGGGGCGAC 
TACCTGCTCA AGACCGAGAT GGGTGCCGGG CACGGCGGGC CGAGCGGTCG GTACGACGCC 
TGGCGTGAGG AGGCCTTCAT CAACGCCTGG CTGCTCGACC AGCTCGGCCG CGCCTGA

Protein sequence

MTIETPAPVA KRMPTERTHH GDTFTDEYAW LAGKDDPATI AYLTTENAYT EARTAHLADL 
REQLFEEIRQ RTQETDLSVP ARKGGHWYYT RTVEGQQYGV QCRRAVHDGE TDPPVSQDGA 
PLADEEVLLD GNVLAAGHDF FALGAFDVSP DGRWLAYSTD FSGDERFTLR VKDLTTGELL 
PDEVPGTFYG TAWSADASVL FYVTVDDAWR PNRVWRHTLG TSASEDVVVY QEDDERFWVG 
VELTRSEKFL LIDIHSKVTS EVLAIPAGNP TGAPVPVAPR RQGVEYTVEH HGHRFLILHN 
DGAEDFALAY TSADAPGDWV PLIEHRPGTR LEAVDAFENH LVVTLRANGL TGLRVLPIGG 
GDSHDIDFPE PLYSVGLDSN PEYRTGQLRF RYTSLVTPDS VYDYDLVTRR MIQRRQRPVL 
PGPDGRPYDP AGYEQHRDWA IADDGTRVPI SLVCRAGTPR DGSAPCVIYG YGSYEASMDP 
WFSVARLSLL DRGVVFAVAH IRGGGELGRR WYDQGKLLAK KNTFTDFVAC ARHLVEAGWT 
ATDRLVARGA SAGGLLMGAV ANLAPDAFTG IVAQVPFVDA LTSMLDPSLP LTVTEWEEWG 
NPLDDPEVYA YMRSYTPYEN VRAVDYPAIL AVTSLNDTRV LYHEPAKWIA RLRATAPRGD 
YLLKTEMGAG HGGPSGRYDA WREEAFINAW LLDQLGRA