Gene SeD_A4057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4057
Symbol
ID	6873474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3898932
End bp	3900209
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	52%
IMG OID	642787006
Product	2,3-diketo-l-gulonate trap transporter large permease yian
Protein accession	YP_002217633
Protein GI	198242335
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.998541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.502761
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTGG TGATATTTCT CTGCTGCCTG CTCGGCGGGA TCGCGATAGG TTTACCCATC 
GCCTGGTCGC TGCTGCTTTG CGGCGCTGCT CTGATGGCAT ACCTGGATAT GTTTGACGTG 
CAGATTATGG CGCAAACCCT GGTTAACGGC GCGGACAGTT TCTCCCTGCT GGCTATTCCC 
TTTTTTGTTT TGGCCGGTGA AATCATGAAC GCGGGCGGCC TGTCAAAGCG AATTGTCGAC 
CTGCCGATGA AGCTGGTCGG CCATAAACCC GGCGGCCTGG GCTACGTGGG CGTTATTGCG 
GCAATGATTA TGGCCAGCCT TTCCGGCTCT GCGGTAGCAG ATACCGCTGC GGTCGCCGCG 
CTGCTGGTGC CGATGATGCG CTCCGCAAAC TACCCGATCA ACCGCTCCGT TGGGTTAATC 
GCTTCCGGCG GGATCATTGC GCCAATTATT CCACCCTCGA TTCCTTTTAT TATCTTCGGC 
GTTTCCAGCG GCTTGTCGAT CAGCAAGCTG TTTATGGCCG GGATCGCACC GGGCATCATG 
ATGGGCGCGG CGCTTATGCT CACCTGGTGG TGGCAGGCCG GGCGATTAAA TCTCCCTTCT 
CAGCCTAAAG CAACACCGCG TGAAATCTGG CAATCATTGG TTTCAGGTAT CTGGGCGCTG 
TTTTTACCGG TGATTATTAT CGGCGGCTTC CGTTCCGGAC TTTTCACGCC AACGGAGGCA 
GGGGCGGTTG CCGCGTTTTA CGCCCTCTTT GTCGCCGTTG TTATCTATCG GGAATTAACG 
TTTTCCAGTC TCTACCACGT GCTGGTCAAT GCCGCCAAAA CGACGTCAGT CGTCATGTTT 
CTGGTGGCCG CGGCCCAGGT ATCCGCCTGG CTGATTACGA TCGCGGAATT ACCCATGATG 
GTGTCAGATT TGCTGCAGCC GCTGGTCGAC TCTCCGCGAC TCTTATTTAT CGTCATTATG 
ATCTCAATTA TGGTCGTCGG TATGGTGATG GATTTAACGC CAACGGTGTT AATTCTTACC 
CCTGTATTAT TGCCATTAGT TAAAGAAGCC AATATTGACC CGATTTATTT CGGCGTCATG 
TTCATTATTA ACTGCTCTAT TGGATTAATC ACACCGCCCG TTGGCAACGT CCTCAACGTT 
ATTTCCGGGG TAGCAAAATT GAAATTTGAT GACGCGGTAA GAGGCGTATT CCCTTACGTT 
GTCGTACTGA TGTCGCTGCT GGTTTTATTT ATTTTTATTC CCGAGCTAAT TATCACACCG 
CTTAAATGGA TTAATTAA

Protein sequence

MAVVIFLCCL LGGIAIGLPI AWSLLLCGAA LMAYLDMFDV QIMAQTLVNG ADSFSLLAIP 
FFVLAGEIMN AGGLSKRIVD LPMKLVGHKP GGLGYVGVIA AMIMASLSGS AVADTAAVAA 
LLVPMMRSAN YPINRSVGLI ASGGIIAPII PPSIPFIIFG VSSGLSISKL FMAGIAPGIM 
MGAALMLTWW WQAGRLNLPS QPKATPREIW QSLVSGIWAL FLPVIIIGGF RSGLFTPTEA 
GAVAAFYALF VAVVIYRELT FSSLYHVLVN AAKTTSVVMF LVAAAQVSAW LITIAELPMM 
VSDLLQPLVD SPRLLFIVIM ISIMVVGMVM DLTPTVLILT PVLLPLVKEA NIDPIYFGVM 
FIINCSIGLI TPPVGNVLNV ISGVAKLKFD DAVRGVFPYV VVLMSLLVLF IFIPELIITP 
LKWIN