Gene SeD_A4696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4696
Symbol	dcuB
ID	6871850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4561859
End bp	4563199
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	54%
IMG OID	642787594
Product	anaerobic C4-dicarboxylate transporter
Protein accession	YP_002218192
Protein GI	198245398
COG category	[R] General function prediction only
COG ID	[COG2704] Anaerobic C4-dicarboxylate transporter
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases [TIGR00770] anaerobic c4-dicarboxylate membrane transporter family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTATTTA GTATACAGCT TCTCATAATA TTAATATGTC TGTTTTATGG TGCCCGAAAG 
GGCGGGATCG CGCTCGGGTT GTTGGGTGGT ATCGGTCTGG TCATTCTGGT GTTTGTTTTC 
CATCTCCAGC CAAGCAAACC GCCCGTTGAC GTAATGCTGG TCATTATCGC GGTAGTCGCC 
GCGTCGGCGA CGTTGCAGGC GTCAGGCGGG CTGGATGTGA TGCTGCAGAT TGCCGAAAAG 
CTGCTGCGTC GCAACCCCAA ATACGTCTCT ATTGTGGCGC CGTTCGTCAC CTGTACCCTG 
ACGATTCTGT GTGGGACAGG CCACGTGGTC TACACCATTT TGCCGATTAT CTATGACGTG 
GCGATCAAGA ATAATATCCG TCCGGAACGT CCAATGGCGG CCAGTTCTAT CGGCGCGCAA 
ATGGGCATCA TCGCCAGTCC GGTTTCCGTC GCCGTGGTTT CTCTGGTAGC GATGCTGGGC 
AACGTGACAT TTGACGGAAA ACATCTGGAG TTCCTCGATC TGCTGTCGAT CACCATCCCG 
TCTACCCTGC TCGGTATCCT GGCAATCGGT ATTTTTAGTT GGTTCCGCGG TAAAGATCTG 
GATAAAGACG AAGCGTTTCA GAAATTTATT TCCGTACCGG AAAACCGTCA GTACGTGTAC 
GGCGATACCG CGACGCTGCT GGATAAAAAA CTGCCGAAAA GCAACTGGCT GGCGATGTGG 
ATCTTCCTGG CGGCGATTGC CGTGGTCGCT CTCCTGGGCG CGGACTCCGA CTTACGTCCA 
ACCTTCGGCG GCAAACCGTT GTCGATGGTG CTGGTCATTC AGATGTTTAT GCTGCTGACC 
GGGGCGCTCA TTATCATCCT GACCAAAACC AATCCTGCGT CTATCTCAAA AAACGAAGTT 
TTTCGTTCCG GTATGATTGC GATTGTCGCG GTATACGGGA TCGCCTGGAT GGCGGAAACC 
ATGTTCGGCG CGCATATGTC GGAAATTCAG GGCGTGCTGG GCGAAATGGT CAAAGAGTAT 
CCGTGGGCCT ACGCCATCGT TCTGCTGCTG GTCTCCAAGT TTGTTAACTC CCAGGCAGCG 
GCGCTGGCGG CGATTGTTCC CGTCGCGCTG GCTATCGGTG TCGATCCGGC GTATATCGTG 
GCCTCTGCGC CGGCATGTTA TGGCTACTAT ATCCTGCCGA CCTACCCAAG CGATCTGGCG 
GCGATTCAGT TTGACCGTTC CGGCACAACC CGTATTGGCC GCTTCGTCAT TAACCACAGC 
TTCATTCTGC CGGGTTTGAT TGGCGTGAGC GTCTCCTGCG TCTTTGGCTG GATCTTTGCC 
GCAATGTACG GATTCCTGTA A

Protein sequence

MLFSIQLLII LICLFYGARK GGIALGLLGG IGLVILVFVF HLQPSKPPVD VMLVIIAVVA 
ASATLQASGG LDVMLQIAEK LLRRNPKYVS IVAPFVTCTL TILCGTGHVV YTILPIIYDV 
AIKNNIRPER PMAASSIGAQ MGIIASPVSV AVVSLVAMLG NVTFDGKHLE FLDLLSITIP 
STLLGILAIG IFSWFRGKDL DKDEAFQKFI SVPENRQYVY GDTATLLDKK LPKSNWLAMW 
IFLAAIAVVA LLGADSDLRP TFGGKPLSMV LVIQMFMLLT GALIIILTKT NPASISKNEV 
FRSGMIAIVA VYGIAWMAET MFGAHMSEIQ GVLGEMVKEY PWAYAIVLLL VSKFVNSQAA 
ALAAIVPVAL AIGVDPAYIV ASAPACYGYY ILPTYPSDLA AIQFDRSGTT RIGRFVINHS 
FILPGLIGVS VSCVFGWIFA AMYGFL