Gene SeD_A4791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4791
Symbol
ID	6873015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4644649
End bp	4645575
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	51%
IMG OID	642787682
Product	hypothetical protein
Protein accession	YP_002218276
Protein GI	198242021
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00231071
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACCC AACGCCAGGC CTCCCCGTTT GCCCGCAAAA ACGTCGTTTA TGTGTGTGCC 
GCATTTTGTT GCTTGCTATG GGGCAGCGCT TATCCAGCCA TCAAAAGCGG TTATGACCTC 
TTTCAGATAG CCACCGATGA TATCCCTTCT AAAATTGTTT TTGCTGGTTA TCGTTTTTTG 
TTTGCGGGTG GGTTGCTACT ACTGTTCGCG CTGCTTCAGC GTAAACCGAT TGGTCGGTTT 
CGTCCGCGCC AGTTTGCTCA GTTGACGTTA CTGGGGCTGA CTCAGACGTC GCTGCAATAT 
CTCTTTTTCT ATATCGGCCT TGCGTTCACC TCCGGCGTGA AAGGCTCAAT CATGAACGCG 
ACAGGCACAT TCTTCAGCGT ATTGCTGGCG CACTTTATTT ATCAGAACGA CCGATTGAGC 
TACAACAAAA CGCTCGGCTG TATTCTGGGC TTTGCGGGCG TCATGGTGGT GAACGTCAGC 
AACGGCCTGG ATTTCAGCTT TAATCTGCCG GGAGAAGGCT CCGTGGTGCT GGCGGCGTTT 
ATTCTTTCTG CGGCCACATT GTATGGCAAA CGTCTCTCGC AGACGGTCGA TCCGATGGTC 
ATGACTGGCT ATCAATTGGG GATTGGCGGT CTGGTACTGG TCATTGGCGG TTACGTTTTT 
GGCGGTACGC TGACGATACA TGGCTTCTCG TCGGTGGCGA TTTTAGTCTA CCTGACGCTG 
CTCTCGTCGG TCGCTTTTGC GCTATGGAGC ATTTTACTCA AATATAATCG CGTGGGGATG 
ATTGCGCCGT TTAACTTTCT GATCCCGGTT TCTGGCGCGG CTCTTTCGGC TATTTTTCTC 
GGCGAGAATA TATTGGAGTG GAAATACATG ATTGCGCTGG TGCTGGTGTG TTCGGGGATT 
TGGTGGGTGA ATAAGGTGAA GCGGTAA

Protein sequence

MDTQRQASPF ARKNVVYVCA AFCCLLWGSA YPAIKSGYDL FQIATDDIPS KIVFAGYRFL 
FAGGLLLLFA LLQRKPIGRF RPRQFAQLTL LGLTQTSLQY LFFYIGLAFT SGVKGSIMNA 
TGTFFSVLLA HFIYQNDRLS YNKTLGCILG FAGVMVVNVS NGLDFSFNLP GEGSVVLAAF 
ILSAATLYGK RLSQTVDPMV MTGYQLGIGG LVLVIGGYVF GGTLTIHGFS SVAILVYLTL 
LSSVAFALWS ILLKYNRVGM IAPFNFLIPV SGAALSAIFL GENILEWKYM IALVLVCSGI 
WWVNKVKR