Gene SNSL254_A1401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1401
Symbol	gapA
ID	6483973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1370663
End bp	1371658
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	51%
IMG OID	642736793
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_002040547
Protein GI	194446706
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.00482616
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTATCA AAGTAGGTAT CAACGGTTTT GGCCGTATCG GTCGCATTGT TTTCCGTGCT 
GCTCAGAAAC GTTCTGACAT CGAGATCGTT GCAATCAACG ACCTGTTAGA CGCAGAGTAC 
ATGGCATACA TGCTGAAATA TGACTCCACT CACGGCCGTT TCGACGGTAC TGTTGAAGTG 
AAAGACGGTC ATCTGATCGT TAACGGTAAA AAAATCCGTG TTACCGCTGA ACGCGATCCG 
GCTAACCTGA AATGGGACGA AGTTGGTGTT GACGTAGTGG CTGAAGCTAC CGGTATCTTC 
CTGACTGACG AAACCGCGCG TAAACACATC ACCGCTGGCG CGAAAAAAGT GGTTCTGACG 
GGTCCGTCTA AAGACAACAC CCCAATGTTT GTTAAAGGCG CTAACTTTGA CAAATACGAA 
GGCCAGGACA TCGTTTCCAA CGCTTCCTGC ACCACCAACT GCCTGGCGCC GCTGGCTAAA 
GTTATCAACG ACAACTTCGG CATCATCGAA GGTCTGATGA CTACTGTTCA CGCGACTACC 
GCAACCCAGA AAACCGTTGA CGGCCCGTCT CACAAAGACT GGCGCGGCGG CCGCGGCGCA 
TCTCAGAACA TCATCCCGTC CTCTACTGGC GCTGCTAAAG CGGTAGGTAA AGTACTGCCG 
GAACTGAATG GCAAACTGAC TGGTATGGCG TTCCGCGTTC CGACTCCGAA CGTATCCGTT 
GTTGACCTGA CCGTTCGTCT GGAAAAAGCG GCTACCTACG AGCAGATCAA AGCTGCTGTT 
AAAGCTGCTG CCGAAGGCGA AATGAAAGGC GTTCTGGGTT ACACCGAAGA CGACGTTGTA 
TCTACCGATT TCAACGGCGA AGTATGCACT TCCGTGTTCG ATGCTAAAGC AGGCATCGCG 
CTGAACGACA ACTTCGTGAA ACTGGTCTCC TGGTACGATA ACGAAACCGG TTACTCCAAC 
AAAGTACTGG ACCTGATTGC TCACATCTCC AAATAA

Protein sequence

MTIKVGINGF GRIGRIVFRA AQKRSDIEIV AINDLLDAEY MAYMLKYDST HGRFDGTVEV 
KDGHLIVNGK KIRVTAERDP ANLKWDEVGV DVVAEATGIF LTDETARKHI TAGAKKVVLT 
GPSKDNTPMF VKGANFDKYE GQDIVSNASC TTNCLAPLAK VINDNFGIIE GLMTTVHATT 
ATQKTVDGPS HKDWRGGRGA SQNIIPSSTG AAKAVGKVLP ELNGKLTGMA FRVPTPNVSV 
VDLTVRLEKA ATYEQIKAAV KAAAEGEMKG VLGYTEDDVV STDFNGEVCT SVFDAKAGIA 
LNDNFVKLVS WYDNETGYSN KVLDLIAHIS K