Gene SeHA_C3419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3419
Symbol
ID	6491352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3323756
End bp	3324739
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	52%
IMG OID	642743550
Product	trap transporter solute receptor
Protein accession	YP_002047165
Protein GI	194449769
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.670449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACA CACGTTCATT CACAACATCA GCGGTATTAC TGGCCGGCTG TTTGCTACTG 
GCATTTCCAG CGCTCGCCAA AACCACGCTG AAACTGAGCC ACAATCAGGA TAAAAGCCAC 
GCCGTTCACA AAGCGATGAG CTATCTGGCC GATAAAGCGA AAGCCTATTC GGACGGCGAA 
TTAAATATTC GTATTTACCC CAACGCCACG CTGGGCAACG AACGTGAATC GCTGGAATTG 
ATGAACTCCG GCGCTCTGCA AATGGTGAAA GTCAATGCGG CATCGCTGGA GTCTTTTGCG 
CCGGAATATA GCGTGTTTAG CCTGCCGTTT TTATTCCGCG ACCGCGATCA CTACTACAAC 
GTACTGAAAA GCGACTTAGG GAAACGCATT CTCGCGTCCT CCGAAAGCAA AGGCTTCGTC 
GGCTTAACCT GGTACGACGG CGGCGCCCGC AGTTTTTACG CTGGTAAGCC CATCACTCAA 
CCCGACGATT TAGCCGGTAT GAAAATCAGA GTGCAGCAAA GCCCCAGCGC TATCGCGATG 
GTGAAAGCGC TCGGCGGTGT GCCGACGCCG ATGGCGCAAG GCGAACTCTA TACCGCGCTC 
CAGCAAGGCG TGGTCGATGG CGGCGAAAAC AACCCCGTGG TTTATGCCGA TATGCGTCAT 
GCGGAGGTGG CGAAATTCTA TTCCCGCGAC GAGCACACGA TGGTGCCGGA TGTCCTGGTC 
ATCAGTACCA AAGTACTTAA CAAATTGAGC GATAAAGAGC GGAAAGCGTT ATATAAAGCC 
GCAGATGAAT CCATGCAGCA AATGAAAGAT GTCATCTGGC CCGCCGCGGA AAAAGAGGCT 
TATGAGAGCA TGAAGGCCAT GAACGCGACT GTTGTTGATA TTGATAAATC CGCGTTCAAA 
CAGCGTGTTA AGCCCTTGTT TGATGAGTTC CGCGCAAAAG ACGCTCAGTC AGCGAAGGAT 
CTGGAATACA TCGAGAATAT GTAA

Protein sequence

MKNTRSFTTS AVLLAGCLLL AFPALAKTTL KLSHNQDKSH AVHKAMSYLA DKAKAYSDGE 
LNIRIYPNAT LGNERESLEL MNSGALQMVK VNAASLESFA PEYSVFSLPF LFRDRDHYYN 
VLKSDLGKRI LASSESKGFV GLTWYDGGAR SFYAGKPITQ PDDLAGMKIR VQQSPSAIAM 
VKALGGVPTP MAQGELYTAL QQGVVDGGEN NPVVYADMRH AEVAKFYSRD EHTMVPDVLV 
ISTKVLNKLS DKERKALYKA ADESMQQMKD VIWPAAEKEA YESMKAMNAT VVDIDKSAFK 
QRVKPLFDEF RAKDAQSAKD LEYIENM