Gene Cwoe_1625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_1625
Symbol
ID	8732065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	1712260
End bp	1713939
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	70%
IMG OID	646502243
Product	Mammalian cell entry related domain protein
Protein accession	YP_003393428
Protein GI	284043088
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.164573
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCCTC CGAAGAAGAG AGACAGCCGC GCTGTGCCGC CCACCAAGCG CAAGCATTGG 
AGCCGCTTCC GCGTCGGCCT GATCGCGATC GTCGTGCTGA TCATCCCGGT CTACCTGGCG 
TTCACGAAGG ACATTCCGTT CACCAGCGGC TACCGCGTGA CGGCGGTGTT CGAGTCGGCC 
AACAACCTGC GCGCCGGCTC GCCCGTGCGC ATCGCGGGCG TGAACGTCGG CAGAGTCAAG 
TCGGTCGCCC GCTACAAGGA CACCAACCTG TCGCAGGTCG AGATGGAGAT CAGCGAGGAC 
GGCCTGCCGA TCCACGAGGA CGCGACGCTC AAGATCCGCC CGCGCATCTT CCTCGAGGGC 
AACTTCTTCG TCGACCTCAG ACCCGGCACG CCCGGCTCGC CCGACGTGCC CGACGGCGGC 
ACGATCGGCG TCACGCAGAC GTCGACCCCC GTCCAGCTCG ACCAGCTGCT GACCGCACTC 
CAGTCGGACT CGCGCGAGGA CCTTCAGCAC GTGCTCGAGG AGTACGGCGC GGCGCTCAAC 
TCGAAGCCGA CCCCGGAGCA GGACGCCGAG CTGCCCGAGT CCGTGCGCGG CCTCACCGGC 
GCACAGGGCC TCAACAACGC GGCGGCGCCC GGGGCGAGAG CGCTGCGGAA CGCGACGATC 
GTCAACGACG CGATCCGCGG CGAGAAGCCG GGCGACCTCG CCAAGACGAT CGCCAGCGTC 
GCACGGTTGT CGAGAACGCT CGAAAGCCGC GAGGGACAGT TGCAGGACCT GATCGTGAAC 
TTCAACCTCA CCGCCAGCGC CTTCGCCAAC CAGAGCGGCG CGCTGAGCGA GACGATCCGC 
CTGCTCGGGC CGACGCTCGC GACCGCGAGA AGCGCGCTGC GCAGCGTCGA CGCCGCGCTG 
CCGTCGACGC GCGCATGGGC GCGCGAGATC CTGCCCGGCG TGCGCGAGAC GGCGGCGACC 
GTCAACGCGT CCTTCCCGTG GATAGAGCAG ACGCGCGCGC TGCTCGGCCC GGACGAGCTG 
CAAGGGCTGA TGGCTGAGCT GACCCCCGCC ACGAAGGACC TCGCGAGACT CACGAACGCG 
TCGATCAGAC TGCTGCCGGA GATCGACGAC TTCTCGCAGT GCTTCGCGAA GGTCATTCTC 
CCGACGGGCA ACGTCGGCCT CGAGGACGGC GCGCTCACGA ACCGCCGCTC GGACGGCAGC 
ATCGTCGAGA GCTACAAGGA GTTCTGGTAC GGCCTCGTCG GCCTGACGAG CGCCGGGCAG 
GGCTTCGACG GCAACGGCGC CTACCTCCGA GCCACCGCGG CTGGAGGCCA GTGGAACGTC 
GCTCCCGGGA TCTCGCGGTA TGCCGCGGGT GGAACCGTCG AGAAGACGCT GACGGGGCTC 
GCGACGCAGA GACCGCTCGG CACGCGGCCG CTCTATTCGG CGAGATCCCC TGCGATCAAG 
ACCGACGTGC CGTGCCGGAG CAACCCGGTT CCGGACCTCA ACGGCCCGCA GGCCGGCCCA 
GGTGCGGCAC CGAGAAGCAT CCAGGTGCCG ACGCCGCCGC CGGTCGAGAG AAGAGTGGAG 
ACGCCCACGA CCCCGCCCGC CAGAACGGCC GCATCAGACG ACACCTCGGC CAGAACGGCG 
TCGGTCGGCT CTGAGCTGCT CTCGCGCCTC AGCCCGCTCG CGAACGGGGG CGGCAGATGA

Protein sequence

MSPPKKRDSR AVPPTKRKHW SRFRVGLIAI VVLIIPVYLA FTKDIPFTSG YRVTAVFESA 
NNLRAGSPVR IAGVNVGRVK SVARYKDTNL SQVEMEISED GLPIHEDATL KIRPRIFLEG 
NFFVDLRPGT PGSPDVPDGG TIGVTQTSTP VQLDQLLTAL QSDSREDLQH VLEEYGAALN 
SKPTPEQDAE LPESVRGLTG AQGLNNAAAP GARALRNATI VNDAIRGEKP GDLAKTIASV 
ARLSRTLESR EGQLQDLIVN FNLTASAFAN QSGALSETIR LLGPTLATAR SALRSVDAAL 
PSTRAWAREI LPGVRETAAT VNASFPWIEQ TRALLGPDEL QGLMAELTPA TKDLARLTNA 
SIRLLPEIDD FSQCFAKVIL PTGNVGLEDG ALTNRRSDGS IVESYKEFWY GLVGLTSAGQ 
GFDGNGAYLR ATAAGGQWNV APGISRYAAG GTVEKTLTGL ATQRPLGTRP LYSARSPAIK 
TDVPCRSNPV PDLNGPQAGP GAAPRSIQVP TPPPVERRVE TPTTPPARTA ASDDTSARTA 
SVGSELLSRL SPLANGGGR