Gene SeHA_C4076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4076
Symbol
ID	6488558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3959916
End bp	3961298
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	55%
IMG OID	642744176
Product	putative transporter
Protein accession	YP_002047781
Protein GI	194451859
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.591118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGTG AAATTCTCTC CGTTAAGGAG AAGATTGGCT ATGGTATGGG CGATGCCGCC 
AGCCACATCA TCTTTGATAA CGTCATGTTA TATATGATGT TCTTCTATAC CGATATTTTC 
GGCATTCCCG CTGGTTTTGT TGGCACCATG TTTTTACTGG CGCGTGCGCT TGATGCCATC 
TCCGACCCTT GTATGGGCCT GCTGGCCGAC CGCACCCGCT CTCGCTGGGG CAAATTCCGA 
CCCTGGGTGC TGTTTGGCGC GTTGCCGTTT GGTATCGTTT GTGTGCTGGC TTATAGCACG 
CCGGATCTCA GTCTGAACGG CAAAATGATT TATGCCGCCA TCACCTACAC GTTGCTCACC 
CTTCTGTACA CTGTGGTCAA CATCCCTTAC TGCGCGTTGG GGGGTGTAAT AACCAATGAC 
CCAACGCAGC GTATCTCCCT GCAATCCTGG CGCTTTGTGC TGGCAACGGC GGGCGGAATG 
CTCTCTACCG TACTGATGAT GCCTCTGGTG AAACTGATTG GCGGCGAGAA TAAGGCGCTG 
GGCTTCCAGG GGGGTATCGC GGCGCTCTCG GTGGTGGCGT TCCTGATGCT GGCGTTCTGC 
TTCTTTACCA CCAAAGAGCG CGTTGAAGCG CCTGCCACCC ATACCTCCAT GCGTGAAGAC 
CTGCGTGATA TCTGGCACAA CGACCAGTGG CGCATAGTCG GCCTGCTCAC CATCCTGAAT 
ATTCTGGCGG TATGCGTGCG CGGCGGGGCG ATGATGTATT ACGTCACCTG GATATTGGGC 
AAACCGGGCG TGTTTGTCGC CTTCCTCACC ACCTATTGTG TCGGCAACCT GATTGGCTCG 
GCGCTGGCAA AACCGTTGAC CGACTGGAAA TGCAAAGTGA GCGTTTTCTG GTGGACCAAC 
GCCTTACTCG CAGTAATCAG CGTGGCGATG TTCTTCGTAC CGATGCACGC CACGATCGCT 
ATGTTCGTCT TTATCTTTGT GATTGGCGTA TTGCACCAGT TAGTCACGCC TATCCAGTGG 
GTGATGATGT CTGACACCGT CGACTATGGC GAATGGTGTA ACGGCAAACG CCTGACGGGG 
ATCAGTTTTG CCGGCACGTT GTTCGTGCTG AAACTGGGTC TTGCCCTCGG CGGGGCGCTG 
ATTGGCTGGA TGCTGGCAGG CGGCGGTTAC GACGCGGCGG CGAAAACGCA AAACAGCGCC 
ACGATCAGCA TCATCATCGC TCTGTTCACT ATCGTCCCGG CCATCTGTTA TCTGCTGAGC 
GCCGCGATCG CTAAACGCTA CTACACCCTG AAAAGCCCGT TCCTGAAAAC CATTCTGGAG 
CAACTGGCGC AGGGCGCACA CCGCAACGAA CAAGAATTTA CCCATAAAGA ATTGCAAAAC 
TAA

Protein sequence

MKSEILSVKE KIGYGMGDAA SHIIFDNVML YMMFFYTDIF GIPAGFVGTM FLLARALDAI 
SDPCMGLLAD RTRSRWGKFR PWVLFGALPF GIVCVLAYST PDLSLNGKMI YAAITYTLLT 
LLYTVVNIPY CALGGVITND PTQRISLQSW RFVLATAGGM LSTVLMMPLV KLIGGENKAL 
GFQGGIAALS VVAFLMLAFC FFTTKERVEA PATHTSMRED LRDIWHNDQW RIVGLLTILN 
ILAVCVRGGA MMYYVTWILG KPGVFVAFLT TYCVGNLIGS ALAKPLTDWK CKVSVFWWTN 
ALLAVISVAM FFVPMHATIA MFVFIFVIGV LHQLVTPIQW VMMSDTVDYG EWCNGKRLTG 
ISFAGTLFVL KLGLALGGAL IGWMLAGGGY DAAAKTQNSA TISIIIALFT IVPAICYLLS 
AAIAKRYYTL KSPFLKTILE QLAQGAHRNE QEFTHKELQN