Gene Cwoe_3813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3813
Symbol
ID	8734268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4051054
End bp	4052067
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	71%
IMG OID	646504435
Product	aliphatic sulfonates family ABC transporter, periplasmic ligand-binding protein
Protein accession	YP_003395605
Protein GI	284045265
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.939168
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.433555
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGC GACTCGCCTG GCTGGCCACC TCGATCGCGA TGCTGCTCGC GGCGACGGTG 
CTGGCGGCGT GCGGCGGCGA CGACTCCACC GACGCGACGG CCGCGAGCGC GTCGTCGTCG 
GCGTCGTCGG AGGGGGCGAC CGTCAAGATC GGCACGCTCC AGGGCGTGAC GCTCGCCGCG 
GTCGCGAGAC ACATCGGCTC GATCGACAGA GCGCTTGCGA GCGTCGGCGC GAGAGCGAGC 
TACGAGGGCC CGTTCCCCGC GATGGTGCCG GCGATCGAGG CGATGAACGC GGGCGACGTC 
GACATCACCT ACGGCTCGAT CTCGGCCGCG ATCGGCGCGC TGGCGGGAAA CTCCGACTTC 
AAGATCTTCG CGATCGAGCC CAACCAGCCC GAGAACGAGG GGATCATCGC CGGCAGAGAC 
AGCGGGATCG CGACCGCCGC CGACCTGAAG GGCAAGAAGA TCGCGGTCAA CAGAGCGGGC 
ACGGGCGAGT ACCTGACGCT GCTCGCGCTC GACAGAGCCG GCCTCAGCAG AGACGACGTC 
GAGCTGGTCT ACCTGCCGCC GGCCGACGCG GCGAGCGCGT TCGGCAGCGG GCAGGTCGAC 
GCGTGGGCGA CGTGGTCGTC GTTCACCGGC CTGGCGCAGG ACAAGCTCGG CGGCAGACTC 
GTGATCTCCG GCGGCGAGCT GGGCTCGCTC AACGACACGC CGTACATCGT CTCCAGCGAG 
TTCGCCGAGC GGCACCCGGC GCTCGTCGCC GCGGTCTACC GCGGTCTCCA GGACGCGGCC 
GCGTGGATCG CGGCGAACCC CGCCGAAGCC GCGAGACTGT ACGCCGACGC CGGCCTGCCG 
GACACGGTCG CCAGAGCGCA GGTCGACGCG GCCGAGAGAC TGGAGCCGAT CACGCCGGCG 
ATCTTGGCGC GCTTCCAGCA GGTCGCGAGG TACGTCGCCG AAAGAGGCGT CGTGCCGGGC 
GAAGTCGACC TGAGCGACCG CACGATCGAC GACGTGGAGG AGGCACGCAG ATGA

Protein sequence

MTKRLAWLAT SIAMLLAATV LAACGGDDST DATAASASSS ASSEGATVKI GTLQGVTLAA 
VARHIGSIDR ALASVGARAS YEGPFPAMVP AIEAMNAGDV DITYGSISAA IGALAGNSDF 
KIFAIEPNQP ENEGIIAGRD SGIATAADLK GKKIAVNRAG TGEYLTLLAL DRAGLSRDDV 
ELVYLPPADA ASAFGSGQVD AWATWSSFTG LAQDKLGGRL VISGGELGSL NDTPYIVSSE 
FAERHPALVA AVYRGLQDAA AWIAANPAEA ARLYADAGLP DTVARAQVDA AERLEPITPA 
ILARFQQVAR YVAERGVVPG EVDLSDRTID DVEEARR