Gene SeHA_C4023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4023
Symbol
ID	6491404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3905736
End bp	3907046
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	48%
IMG OID	642744124
Product	glucarate transporter
Protein accession	YP_002047729
Protein GI	194448436
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.957782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACAA TAATAAAGCG CACAAAAGTG CGTCATACCA TTCTTATATT TTTATTTCTT 
GCTACCGTAT TTAATTATGC GGATCGCGCA ACTCTATCCG TAGTTGCCCC AATAATGAGT 
AAAGAATTAG GTTTTGATCC GGAAGCGATG GGCCTGGCCT TCTCCTCATT TGGTATCGCC 
TATGTCATTA TGCAACTACC CGGTGGTTGG CTATTAGACC GCTACGGTTC ACGACTGGTT 
TACGGTTGCG CATTGATTGG CTGGTCGTTA GTAACCATGT TTCAGGGAAC GATCTATCTG 
TATGGCAGCC CATTAATTGT ACTGGTTATT CTACGTCTGC TGATGGGCGC GATTGAAGCG 
CCTGCCTTTC CGGCGAACAG TCGTTTAAGC GTACAATGGT TTCCCAATAA TGAACGAGGT 
TTCGTTACTT CAGTTTATCA GGCTGCGCAA TATATCTCGC TGGGCATTAT CACCCCGCTA 
ATGACGATCA TTCTGCATAA TTTAAGCTGG CATTTTGTCT TCTATTATAT TGGCGCTATT 
GGCGTGATGC TCGGTATATT CTGGTTAATG AAAGTCAAAG ATCCGATGCA CCACCCAAAA 
GTTAATCAAG CGGAAATTGA CTATATTCGT AGCGGTGGTG GCGAGCCCTC TCTGGGCTGT 
AAAAAGGAGC CGCAGAAAAT AACGTTCGCG CAGATTAAAA CCGTCTGTGT TAACCGGATG 
ATGATCGGTG TTTACATCGG GCAATTCTGC GTCACCTCTA TCACCTGGTT CTTCCTGACC 
TGGTTCCCGA CCTACCTGTA CCAGGCGAAA GGCATGTCGA TTCTGAAAGT CGGTTTTGTG 
GCCAGTATTC CAGCCATTGC CGGTTTTATT GGCGGCCTGC TCGGCGGCGT GTTCTCCGAC 
TGGCTGCTCA AACGCGGCTA TAGCCTTACC GTCGCGCGGA AACTGCCTGT TATCTGCGGT 
ATGTTGCTCT CTTGCGTAAT TGTGATCGCC AACTACACCT CTTCAGAATT TGTGGTCATT 
GCGGCGATGA GTCTGGCCTT TTTTGCCAAA GGGTTTGGTA ACCTGGGCTG GTGCGTACTC 
AGCGACACCT CGCCGAAGGA AGTTCTGGGT ATTGCTGGCG GCGTATTTAA CATGTGCGGC 
AATATGGCAA GCATCGTTAC GCCGCTGGTC ATCGGCGTGA TTCTTGCCAA TACTCAGTCG 
TTCGACTTTG CCATTTTATA CGTTGGCTCG ATGGGACTTA TTGGTCTCAT TTCATATCTG 
TTTATCGTCG GCCCGCTGGA TCGCATCACG CTGACATCAT CCGCAGCCTG A

Protein sequence

MNTIIKRTKV RHTILIFLFL ATVFNYADRA TLSVVAPIMS KELGFDPEAM GLAFSSFGIA 
YVIMQLPGGW LLDRYGSRLV YGCALIGWSL VTMFQGTIYL YGSPLIVLVI LRLLMGAIEA 
PAFPANSRLS VQWFPNNERG FVTSVYQAAQ YISLGIITPL MTIILHNLSW HFVFYYIGAI 
GVMLGIFWLM KVKDPMHHPK VNQAEIDYIR SGGGEPSLGC KKEPQKITFA QIKTVCVNRM 
MIGVYIGQFC VTSITWFFLT WFPTYLYQAK GMSILKVGFV ASIPAIAGFI GGLLGGVFSD 
WLLKRGYSLT VARKLPVICG MLLSCVIVIA NYTSSEFVVI AAMSLAFFAK GFGNLGWCVL 
SDTSPKEVLG IAGGVFNMCG NMASIVTPLV IGVILANTQS FDFAILYVGS MGLIGLISYL 
FIVGPLDRIT LTSSAA