Gene SeD_A2567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2567
Symbol
ID	6875581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2446793
End bp	2448598
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	52%
IMG OID	642785642
Product	extracellular solute-binding protein
Protein accession	YP_002216300
Protein GI	198244480
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.00156108
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGCGC GCGTAATGCT TCTGCTTGTC GCACTGGTTA GCGCTGGCGC CCAGGCCCAG 
GAAATCAAAG AAAGCTACGC TTTCGCCGTA CTCGGCGAAC CTAAGTATGC TTTTAACTTT 
AATCACTTTG ATTATGTGAA TCCTGCTGCG CCGAAAGGCG GTCAGATGAC GCTTTCCGCC 
ATTGGTACGT TCGATAATTT CAATCGCTAC TCGCTGCGCG GCAATCCCGG CGTACGTACC 
GAAGCCCTTT ACGATACGCT TTTTACCACC TCGGATGATG AGCCCGGAAG CTATTATCCG 
CTGATTGCCG ACCATGCCCG CTATGCCGCC GACTATTCCT GGGTGGAAAT CTCGATTAAC 
CCCCGCGCTC GTTTTCACGA TGGCACGCCC ATTACCGCCC GCGATGTGGC CTTTACCTTT 
CATAAGTTTA TGACCGAAGG CGTACCGCAG TTCCGTCTGG TCTATAAAGG TACTACCGTG 
AAGGCGATTG CGCCTTTAAC CGTGCGAATT GAGCTGGCGA AGCCTGGTAA AGAAGACATG 
CTTAGTCTGT TTTCACTACC GATCATGCCC GAAAAATTCT GGAAAAATCA CAAACTCAGC 
GATCCACTTT CAACGCCGCC CTTAGCCAGC GGGCCATACC GGATTACTCA GTGGAAAATG 
GGCCAGTACA TTGTCTATTC ACGCGTCAAA AACTACTGGG CGGCTAATCT GCCGGTCAAT 
CGTGGACGTT TTAACCTCGA CACTATCCGC TACGATTACT ACCTTGATGA CAATGTCGCT 
TTCGAGGCGT TTAAAGCGGG CGCATTTGAT CTACGGCTGG AAAACGACGC TAAAAACTGG 
GCAACGCGCT ATATCGGTAA AAATTTCGAT AATCATTACA TCATTAAAGA AGAGCAGAAA 
AACGAGTCGG CGCAGGACAC ACGCTGGCTG GCCTTTAATA TTCAGCGCCA GGTATTTAAA 
GACCGGCGGG TACGTGAAGC TGTCACCCTG GCCTTCGATT TTGAGTGGAT GAATAAAGCG 
CTGTTCTATA ATGCCTGGAG CCGAACCAAC AGTTACTTCC AGAATACCGA GTACGCCGCC 
AGAAATTACC CTGACGCCGA TGAGCTGGTA TTACTCGCGC CGATGAAAAA AGATCTTCCT 
CCTGAAGTCT TCACTCAGAT CTATCAGCCG CCGGTCTCTA ACGGCGACGG CTACGATCGC 
GAAAATCTTC TTAAAGCTGA CGCCTTGTTG ACGCAGGCCG GATGGGTGAT CAACGGACAG 
CAACGGGTCA ATAGCGTCAC CGGTAAGCCT CTGACGTTTG AACTTCTCCT TCCTGCCAGC 
AGTAATAGCC AGTGGGTTCT GCCCTTCCAG CATAATCTTC AGCGTCTGGG CATTACGATG 
ACTATCCGTC AGGTTGATAA TTCTCAGCTC ACCAACCGGA TGCGTAGCCG CGACTATGAC 
ATGATGCCGA GGCTATGGCG GGCGATGCCC TGGCCCAGCT CCGATCTACA AATCTCATGG 
GCGTCGGAAT ACATTGACTC CAGTTATAAC GCTCCCGGCG TACAAAGCCC GGTGGTGGAT 
AAACTGATCG CGCAAATTAT CGCAGCGCAG GGTGATAAAG CGAAACTGGT GCCGCTGGGA 
CGGGCGCTGG ATCGCGTGCT GACCTGGAAC TATTACATGC TGCCGATGTG GTATATGGCG 
CAAGACAGGC TCGCCTGGTG GGATAAATTC TCCCATCCGG CGATTCGCCC GGTATATACC 
ATCGGGTTAG ATACCTGGTG GTATGATGTC AACAAAGCCG CCAAGCTACC GGCAGCCAGG 
AGGTAG

Protein sequence

MIARVMLLLV ALVSAGAQAQ EIKESYAFAV LGEPKYAFNF NHFDYVNPAA PKGGQMTLSA 
IGTFDNFNRY SLRGNPGVRT EALYDTLFTT SDDEPGSYYP LIADHARYAA DYSWVEISIN 
PRARFHDGTP ITARDVAFTF HKFMTEGVPQ FRLVYKGTTV KAIAPLTVRI ELAKPGKEDM 
LSLFSLPIMP EKFWKNHKLS DPLSTPPLAS GPYRITQWKM GQYIVYSRVK NYWAANLPVN 
RGRFNLDTIR YDYYLDDNVA FEAFKAGAFD LRLENDAKNW ATRYIGKNFD NHYIIKEEQK 
NESAQDTRWL AFNIQRQVFK DRRVREAVTL AFDFEWMNKA LFYNAWSRTN SYFQNTEYAA 
RNYPDADELV LLAPMKKDLP PEVFTQIYQP PVSNGDGYDR ENLLKADALL TQAGWVINGQ 
QRVNSVTGKP LTFELLLPAS SNSQWVLPFQ HNLQRLGITM TIRQVDNSQL TNRMRSRDYD 
MMPRLWRAMP WPSSDLQISW ASEYIDSSYN APGVQSPVVD KLIAQIIAAQ GDKAKLVPLG 
RALDRVLTWN YYMLPMWYMA QDRLAWWDKF SHPAIRPVYT IGLDTWWYDV NKAAKLPAAR 
R