Gene SeHA_C2453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2453
Symbol
ID	6487693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2363806
End bp	2365611
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	52%
IMG OID	642742636
Product	extracellular solute-binding protein
Protein accession	YP_002046271
Protein GI	194448150
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.958299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.000003014
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGCGC GCGTAATGCT TCTGCTTGTC GCACTGGTTA GCGCTGGCGC CCAGGCCCAG 
GAAATCAAAG AAAGCTACGC TTTCGCCGTA CTCGGCGAAC CTAAGTATGC TTTTAACTTT 
GATCACTTTG ATTATGTAAA TCCTGCTGCG CCGAAAGGCG GTCAGATGAC GCTTTCCGCC 
ATTGGTACGT TCGATAATTT CAATCGCTAT TCGCTGCGCG GCAATCCCGG CGTACGTACC 
GAAGCCCTTT ACGATACGCT TTTTACCACT TCGGATGATG AACCCGGAAG CTATTATCCG 
CTGATTGCCG ACCATGCCCG CTATGCAGCC GACTATTCCT GGGTGGAAAT CTCGATTAAT 
CCCCGCGCTC GTTTTCACGA TGGCACGCCC ATTACCGCCC GCGATGTGGC CTTTACCTTT 
CATAAGTTTA TGACCGAAGG CGTACCGCAG TTCCGTCTGG TCTATAAAGG TACTACCGTG 
AAGGCGATTG CGCCTTTAAC CGTGCGAATT GAGCTGGCGA AGCCTGGTAA AGAAGACATG 
CTTAGTCTGT TTTCATTACC GATCATGCCC GAAAAATTCT GGAAAAATCA CAAACTTAGC 
GATCCGCTTT CAACGCCGCC CTTAGCCAGC GGGCCATACC GGATTACTCA GTGGAAAATG 
GGCCAGTACA TTGTCTATTC ACGCGTCAAA AACTACTGGG CGGCTAATCT GCCGGTCAAT 
CGTGGACGTT TTAACCTCGA CACTATCCGC TACGATTACT ACCTTGATGA CAATGTCGCT 
TTCGAGGCGT TTAAAGCGGG CGCATTTGAT CTACGGCTGG AAAACGACGC TAAAAACTGG 
GCAACGCGCT ATATCGGTAA AAATTTCGAT AATCATTACA TCATTAAAGA AGAGCAGAAA 
AACGAGTCGG CGCAGGACAC ACGCTGGCTG GCCTTTAATA TTCAGCGCCC GGTATTTAAA 
GACCGGCGGG TACGTGAAGC TGTCACCCTG GCCTTCGATT TTGAGTGGAT GAATAAAGCG 
CTGTTCTATA ATGCCTGGAG CCGAACCAAC AGTTACTTCC AGAATACCGA GTACGCCGCC 
AGAAATTATC CTGACGCCGA TGAGCTGGTA TTACTCGCGC CGATGAAAAA AGATCTTCCT 
CCTGAAGTCT TCACTCAGAT CTATCAGCCG CCGGTCTCTA ACGGCGACGG CTACGATCGC 
GAAAATCTTC TTAAAGCTGA CGCCTTGTTG ACGCAGGCCG GATGGGTGAT CAACGGACAG 
CAACGGGTCA ATAGCGTCAC CGGTAAGCCC CTGACGTTTG AACTTCTCCT TCCTGCCAGC 
AGTAATAGCC AGTGGGTTCT GCCCTTCCAG CATAATCTTC AGCGTCTGGG CATTACGATG 
ACTATCCGTC AGGTTGATAA TTCTCAACTC ACCAACCGGA TGCGTAGCCG CGACTATGAC 
ATGATGCCGA GGCTATGGCG GGCGATGCCC TGGCCCAGCT CCGATCTACA AATCTCATGG 
GCGTCGGAAT ACATTGACTC CAGTTATAAC GCTCCCGGCG TACAAAGCCC GGTGGTGGAT 
AAACTGATCG CGCAAATTAT CGCAGCGCAG GGTGATAAAG CGAAACTGGT GCCGCTGGGA 
CGGGCGCTGG ATCGCGTGCT GACCTGGAAC TATTACATGC TGCCGATGTG GTATATGGCG 
CAAGACAGGC TCGCCTGGTG GGATAAATTC TCCCATCCGG CGATTCGCCC GGTATATACC 
ATCGGGTTAG ATACCTGGTG GTATGATGTC AACAAAGCCG CCAAACTACC GGCAGCCAGG 
AGGTAG

Protein sequence

MIARVMLLLV ALVSAGAQAQ EIKESYAFAV LGEPKYAFNF DHFDYVNPAA PKGGQMTLSA 
IGTFDNFNRY SLRGNPGVRT EALYDTLFTT SDDEPGSYYP LIADHARYAA DYSWVEISIN 
PRARFHDGTP ITARDVAFTF HKFMTEGVPQ FRLVYKGTTV KAIAPLTVRI ELAKPGKEDM 
LSLFSLPIMP EKFWKNHKLS DPLSTPPLAS GPYRITQWKM GQYIVYSRVK NYWAANLPVN 
RGRFNLDTIR YDYYLDDNVA FEAFKAGAFD LRLENDAKNW ATRYIGKNFD NHYIIKEEQK 
NESAQDTRWL AFNIQRPVFK DRRVREAVTL AFDFEWMNKA LFYNAWSRTN SYFQNTEYAA 
RNYPDADELV LLAPMKKDLP PEVFTQIYQP PVSNGDGYDR ENLLKADALL TQAGWVINGQ 
QRVNSVTGKP LTFELLLPAS SNSQWVLPFQ HNLQRLGITM TIRQVDNSQL TNRMRSRDYD 
MMPRLWRAMP WPSSDLQISW ASEYIDSSYN APGVQSPVVD KLIAQIIAAQ GDKAKLVPLG 
RALDRVLTWN YYMLPMWYMA QDRLAWWDKF SHPAIRPVYT IGLDTWWYDV NKAAKLPAAR 
R