Gene SNSL254_A3978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3978
Symbol
ID	6483119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3865162
End bp	3866472
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	48%
IMG OID	642739238
Product	putative glucarate transporter
Protein accession	YP_002042948
Protein GI	194446563
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.776069
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACAA TAATAAAGCG CACAAAAGTG CGTCATACCA TTCTTATATT TTTATTTCTT 
GCTACCGTAT TTAATTATGC GGATCGCGCA ACTCTATCCG TAGTTGCCCC AATAATGAGT 
AAAGAATTAG GTTTTGATCC GGAAGCGATG GGCCTGGCCT TCTCCTCATT TGGTATTGCC 
TATGTCATTA TGCAACTACC CGGCGGTTGG CTATTAGACC GCTACGGTTC ACGACTGGTT 
TACGGTTGCG CATTGATTGG CTGGTCGTTA GTAACCATGT TTCAGGGAAC GATCTATTTG 
TATGGCAGCC CATTAATTGT ACTGGTTATT CTACGTCTGC TGATGGGCGC GATTGAAGCG 
CCTGCCTTTC CGGCGAACAG TCGTTTAAGC GTACAATGGT TTCCCAATAA TGAACGAGGT 
TTCGTTACTT CAGTTTATCA GGCTGCGCAA TATATCTCGC TGGGCATTAT CACCCCGCTA 
ATGACGATCA TTCTGCATAA TTTAAGCTGG CATTTTGTCT TCTATTATAT TGGCGCTATT 
GGCGTGATGC TCGGTATATT CTGGTTAATG AAAGTCAAAG ATCCGATGCA CCACCCAAAA 
GTTAATCAAG CGGAAATTGA CTATATTCGT AGCGGTGGTG GCGAGCCCTC TCTGGGCTGT 
AAAAAGGAGC CGCAGAAAAT AACGTTCGCG CAGATTAAAA CCGTCTGTGT TAACCGGATG 
ATGATCGGTG TTTACATCGG GCAATTCTGC GTCACCTCTA TCACCTGGTT CTTCCTGACC 
TGGTTCCCGA CCTACCTGTA CCAGGCGAAA GGCATGTCGA TTCTGAAAGT CGGTTTTGTG 
GCCAGTATTC CAGCCATTGC CGGTTTTATT GGCGGCCTGC TCGGCGGCGT GTTCTCCGAC 
TGGCTACTCA AACGCGGCTA TAGCCTTACC GTCGCGCGGA AACTGCCTGT TATCTGCGGT 
ATGTTGCTCT CTTGCGTAAT TGTGATCGCC AACTACACCT CTTCAGAATT TGTGGTCATT 
GCGGCGATGA GTCTGGCCTT TTTTGCCAAA GGGTTTGGTA ACCTGGGCTG GTGCGTACTC 
AGCGACACCT CGCCGAAGGA AGTTCTGGGT ATTGCCGGCG GCGTATTTAA CATGTGCGGC 
AATATGGCAA GCATCGTTAC GCCGCTGGTC ATCGGCGTGA TTCTTGCCAA TACTCAGTCG 
TTCGACTTTG CCATTTTATA CGTTGGCTCG ATGGGACTTA TTGGTCTCAT TTCATATCTG 
TTTATCGTCG GCCCGCTGGA TCGCATCACG CTGACATCAT CCGCAGCCTG A

Protein sequence

MNTIIKRTKV RHTILIFLFL ATVFNYADRA TLSVVAPIMS KELGFDPEAM GLAFSSFGIA 
YVIMQLPGGW LLDRYGSRLV YGCALIGWSL VTMFQGTIYL YGSPLIVLVI LRLLMGAIEA 
PAFPANSRLS VQWFPNNERG FVTSVYQAAQ YISLGIITPL MTIILHNLSW HFVFYYIGAI 
GVMLGIFWLM KVKDPMHHPK VNQAEIDYIR SGGGEPSLGC KKEPQKITFA QIKTVCVNRM 
MIGVYIGQFC VTSITWFFLT WFPTYLYQAK GMSILKVGFV ASIPAIAGFI GGLLGGVFSD 
WLLKRGYSLT VARKLPVICG MLLSCVIVIA NYTSSEFVVI AAMSLAFFAK GFGNLGWCVL 
SDTSPKEVLG IAGGVFNMCG NMASIVTPLV IGVILANTQS FDFAILYVGS MGLIGLISYL 
FIVGPLDRIT LTSSAA