Gene Cwoe_2989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2989
Symbol
ID	8733434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	3198413
End bp	3199684
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	75%
IMG OID	646503603
Product	major facilitator superfamily MFS_1
Protein accession	YP_003394783
Protein GI	284044443
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.250766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.409989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGCCG ACGTGACCGC CGATCCGCCC GTCCGCCAGC TCGACCGGCG GCTCGTGCTG 
CTGCTGGCGG TCGCGACCGG CGCGGCGGTC GCGAACCTGT ACTACGCGCA GCCGCTGCTG 
GACGTGATCG CAGCGAGACT CGGGACGAGC CCCGGAGTCG CCGGGCTGAT CGTGACCGCG 
TCGCAGATCG GCTACGCCGC CGGGCTCGTC TTCGTCGTCC CGCTCGGCGA CCTCGTCGAG 
CGACGGCGGC TGGTCGTGCG GATGCTGATC GGCTGCGCCG TCGCGCTCGC CGCGTGCGCG 
CTCGCACCCG GGATAGCCGC GCTCGCGCTG GCGATCGTCG TCGTCGGCGT GACGTCGGTC 
GTCGCGCAGG TGCTGGTCCC GTTCGCGGGC GACCTCGCCG CCGACGACGA GCGCGGCCGC 
GTCGTCGGGA CGATCATGAG CGGCCTGCTG ATCGGCATCC TCGCCGCCCG CACGGTCAGC 
GGCTTCGTCG CCGAGCTGGC CGGCTGGCGC GCGATCTACG TGCTCGCTGC GGCGATGATG 
CTCGCCTGCG CCGCCGCCCT GCAGCGGATG CTGCCGGTGA TCGCGCCACG CGCCGTGACG 
CCGTACCGCG CGCTGCTGCG GTCGGTCGGC ACGCTCGTGC GCGAGGAGCC GCTGCTGCGG 
CTGCGGATGG CGTACGGGAT GCTCGGGATC CTGACGTTCA CGCTGCTGTG GACCGCCCTG 
ACGTTCCTGC TCAGCGGCCC CGCCTACGGC TACTCCGAGG GGACGATCGG ACTGTTCGGC 
CTCGCCGGGC TGATCGGCGC GGCCGCCGCG CAGGGCGCCG GCCGCCTCGC CGACCGCGGC 
CACGCGTCCG CCACGACCGT GCTGGGCTGG GTCGCGGTCC TCGTCGGCTG GATCCTCTGC 
GACCTCGGCG GCAGCTCGCT CGTCGCGCTG ATCGCGGGCG TGCTCGTGCT CGACGCCGGC 
GTGCAGGGCC AGCACATCAC CAACCAGTCG CTGATCTACT CGCTCCGGCC GGAGGCGCGC 
AGCCGCCTGA CGACCGCGTA CATGGCCGGC AACTTCAGCG CCGCCGCGCT CGGCTCGGCA 
CTCGCCTCCG CGCTCTGGAG CGTCGGCGGC TGGGACGCCG TCAGCATCGT CGGCGGTGCG 
ACGGCCGTGA TCGCGCTCGC GCTGTGGGGG ATCGACCGCT GGCGGATCAG CCAGGCGGCC 
GCGGTCGCGC CGGCGCCGGT GCCGGCACCC GATCTGTCCG CGGCAACGCC GCGACCGCCG 
CGTCGCGGCT GA

Protein sequence

MPADVTADPP VRQLDRRLVL LLAVATGAAV ANLYYAQPLL DVIAARLGTS PGVAGLIVTA 
SQIGYAAGLV FVVPLGDLVE RRRLVVRMLI GCAVALAACA LAPGIAALAL AIVVVGVTSV 
VAQVLVPFAG DLAADDERGR VVGTIMSGLL IGILAARTVS GFVAELAGWR AIYVLAAAMM 
LACAAALQRM LPVIAPRAVT PYRALLRSVG TLVREEPLLR LRMAYGMLGI LTFTLLWTAL 
TFLLSGPAYG YSEGTIGLFG LAGLIGAAAA QGAGRLADRG HASATTVLGW VAVLVGWILC 
DLGGSSLVAL IAGVLVLDAG VQGQHITNQS LIYSLRPEAR SRLTTAYMAG NFSAAALGSA 
LASALWSVGG WDAVSIVGGA TAVIALALWG IDRWRISQAA AVAPAPVPAP DLSAATPRPP 
RRG