Gene SeHA_C3636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3636
Symbol
ID	6488277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3521827
End bp	3523317
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	55%
IMG OID	642743754
Product	putative sialic acid transporter
Protein accession	YP_002047366
Protein GI	194449265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00891] putative sialic acid transporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACTT CTACCCAGAA CATCCCGTGG TATCGCCATC TCAACCGGGC GCAGTGGCGG 
GCATTTTCCG CTGCCTGGCT GGGATATCTG CTTGATGGTT TTGATTTTGT GTTAATTGCT 
CTTGTACTGA CTGAGGTACA AAGCGAATTT GGGCTGACGA CGGTACAGGC GGCAAGCCTG 
ATTTCTGCGG CTTTTATCTC TCGCTGGTTC GGCGGGTTAT TACTGGGCGC GATGGGCGAT 
CGCTATGGGC GTCGTCTGGC GATGGTCAGC AGCATCATTC TGTTTTCGGT GGGAACCCTG 
GCCTGCGGGT TTGCGCCCGG TTACACCACC ATGTTCATCG CCCGACTGGT GATTGGTATG 
GGCATGGCGG GCGAATATGG TTCCAGCGCG ACCTATGTGA TTGAAAGCTG GCCAAAACAT 
TTACGCAATA AGGCCAGTGG TTTTCTGATT TCCGGCTTCT CCGTCGGCGC GGTCGTTGCC 
GCGCAGGTGT ACAGCCTGGT GGTGCCTGTC TGGGGCTGGC GCGCGCTGTT TTTCATTGGC 
ATTTTGCCAA TTATCTTCGC CCTCTGGCTG CGGAAAAACA TTCCGGAAGC GGAAGACTGG 
AAAGAAAAAC ACGCGGGTAA AGCGCCGGTA CGTACGATGG TCGACATTCT TTATCGGGGC 
GAACATCGCA TCATCAACAT TTTAATGACT TTCGTCGCCG CCGCTGCGCT GTGGTTCTGT 
TTTGCCGGTA ACCTACAAAA TGCTGCGATT GTGGCGGGGC TGGGACTACT GTGCGCGGTT 
ATCTTTATCA GCTTTATGGT GCAGAGCAGC GGTAAACGCT GGCCCACTGG CGTCATGCTG 
ATGCTGGTGG TACTGTTTGC TTTCCTCTAT TCCTGGCCGA TTCAGGCGCT ATTACCCACT 
TATCTGAAAA CCGAGCTGGC CTACGATCCG CATACGGTGG CGAATGTCCT GTTCTTTAGC 
GGATTTGGCG CGGCGGTTGG TTGCTGCGTA GGCGGTTTTC TTGGCGACTG GCTGGGAACG 
CGTAAAGCAT ATGTCTGTAG CCTGCTGGCC TCGCAAATCC TCATTATTCC GGTCTTTGCG 
ATTGGCGGCA CAAACGTCTG GGTTCTGGGT CTGCTACTGT TTTTCCAACA GATGTTGGGG 
CAGGGGATTG CCGGGATTCT ACCGAAACTG ATCGGCGGTT ACTTCGATAC CGATCAGCGC 
GCGGCGGGGC TGGGCTTTAC TTATAACGTC GGCGCGCTCG GCGGCGCGCT GGCGCCGATC 
CTGGGAGCGC TGATCGCTCA ACGTCTGGAT TTGGGCACTG CGCTGGCATC GCTCTCTTTC 
AGCCTGACGT TTGTCGTGAT CCTGCTTATT GGGCTTGATA TGCCGTCTCG CGTACAGCGT 
TGGCTACGTC CGGAAGCGTT ACGCACCCAC GATGCTATTG ACGACAAACC GTTCAGCGGA 
GCCGTACCGC TTGGCAGTGG TAAAGGTGCC TTTGTAAAAA CGAAAAGTTA A

Protein sequence

MSTSTQNIPW YRHLNRAQWR AFSAAWLGYL LDGFDFVLIA LVLTEVQSEF GLTTVQAASL 
ISAAFISRWF GGLLLGAMGD RYGRRLAMVS SIILFSVGTL ACGFAPGYTT MFIARLVIGM 
GMAGEYGSSA TYVIESWPKH LRNKASGFLI SGFSVGAVVA AQVYSLVVPV WGWRALFFIG 
ILPIIFALWL RKNIPEAEDW KEKHAGKAPV RTMVDILYRG EHRIINILMT FVAAAALWFC 
FAGNLQNAAI VAGLGLLCAV IFISFMVQSS GKRWPTGVML MLVVLFAFLY SWPIQALLPT 
YLKTELAYDP HTVANVLFFS GFGAAVGCCV GGFLGDWLGT RKAYVCSLLA SQILIIPVFA 
IGGTNVWVLG LLLFFQQMLG QGIAGILPKL IGGYFDTDQR AAGLGFTYNV GALGGALAPI 
LGALIAQRLD LGTALASLSF SLTFVVILLI GLDMPSRVQR WLRPEALRTH DAIDDKPFSG 
AVPLGSGKGA FVKTKS