Gene Strop_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2018
Symbol
ID	5058481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2289032
End bp	2290375
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	68%
IMG OID	640474283
Product	VWA containing CoxE family protein
Protein accession	YP_001158849
Protein GI	145594552
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.531693
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.264381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCG ACCATCACGA TCGTGCCGAC GAGAATCGGC GGCAGGTGCT CTACTGGCGG 
TTACTGGCCC GGCTCTTCGA CCCGACCGAG CAGCCTACGC TGGAAGCGGC GAGCCTGGCC 
GTGGTCGAGG ACCTGGGGCT GCCCGCCGCG CTGCTGGACC CGGCCGTCTC GGTGGACACT 
GTGGTCCAGC GCTACCCGTC GCTCGCCGCG GAGCTGCGCG GCCTGCTCAC CCCTGCCGAG 
CACGCACCAG TGGCCGACGG CACCGCCACA CCGGAACCCG GCCCAGCCGA GGTGCGGCGG 
GCCGCGCTGG TGTCGAAGGT GCTGCTCAAC GTGTTCGCCG CCGGCACCGG GCCGGTCAGC 
GCCAGCGAGC TGGCCCGGTG GCAGTCCGAC GCCGGCTGGT TTGAGCAGGC GCTCGGTGCC 
GAGCCGGGCG AGCTGCGCCG GCAGGGCGGG ACGGGGCTGG GTGGTGCTCT CGCCGCGCTG 
GAGGGCGACC TGGTACGCCG GATGCATCTG CGCGAGGTGC TCGCCGACCC GGCGCTGGCC 
AGCCGGCTCA CGCCGAGCAT GTCGCTGATC GAGCAGTTGT TGCGGGACAA GGCGAACCTG 
TCCGGGGTAG CGCTGGCCAA CGCCAAGGCG CTGATCCGCC GGTTTGTCGA CGAGGTTGCC 
GAGGTGCTGC GCACGCAGGT GGAGCAGACC AGCGTCGGAA CCATCGACAG GTCGGTGCCG 
CCGAAGCGGG TGTTCCGTAA CCTCGACCTG GATCGCACCA TCTGGCAGAA CCTGACCAAC 
TGGAGCCCCG AGGACCAGCG GCTCTACGTC GATCGCCTCT ACTACCGGCG TACGGCCCGC 
CGTACGACAC CGGCTCGGCT GATCGTGGTG GTGGACCAGT CAGGCTCGAT GGTCGACTCG 
ATGGTCAACT GTACGATCCT GGCGTCGATC TTCGCCGGGC TACCCAAGGT GGATGTGCAT 
CTGATCGCGT ACGACACACA GGCGTTGGAC CTGACCCCGT GGGTGCGCGA CCCGTTCGAG 
GTTCTGCTGC GCACCAAACT GGGTGGCGGC AACGACGGTC CGGTCGCCAT GGCGATGGCC 
CGGCCCAAGA TCGCCGAACC GCGGAACACC GTCATGGTGT GGATTTCGGA CTTCTACGAG 
TTCGACCGAT CGCAGCCCTT GTTCGACGGC ATCGAAGCCG TGCACCGTTC CGGCGTGCGA 
TTCATCCCGG TCGGCTCAGT CAACAGCTCC GGGCAGCAGA GCGTCAATCC CTGGTTCCGG 
CAACGCTTCA AGGACCTGGG CACCCCCGTG ATCTCGGGTC ACATCCGCAA ACTCGTCTTC 
GAGCTCAAGA GCTTTCTCAC CTAG

Protein sequence

MTLDHHDRAD ENRRQVLYWR LLARLFDPTE QPTLEAASLA VVEDLGLPAA LLDPAVSVDT 
VVQRYPSLAA ELRGLLTPAE HAPVADGTAT PEPGPAEVRR AALVSKVLLN VFAAGTGPVS 
ASELARWQSD AGWFEQALGA EPGELRRQGG TGLGGALAAL EGDLVRRMHL REVLADPALA 
SRLTPSMSLI EQLLRDKANL SGVALANAKA LIRRFVDEVA EVLRTQVEQT SVGTIDRSVP 
PKRVFRNLDL DRTIWQNLTN WSPEDQRLYV DRLYYRRTAR RTTPARLIVV VDQSGSMVDS 
MVNCTILASI FAGLPKVDVH LIAYDTQALD LTPWVRDPFE VLLRTKLGGG NDGPVAMAMA 
RPKIAEPRNT VMVWISDFYE FDRSQPLFDG IEAVHRSGVR FIPVGSVNSS GQQSVNPWFR 
QRFKDLGTPV ISGHIRKLVF ELKSFLT