Gene SNSL254_A0410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0410
Symbol	prpD
ID	6485768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	424654
End bp	426105
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	57%
IMG OID	642735834
Product	2-methylcitrate dehydratase
Protein accession	YP_002039608
Protein GI	194445361
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID	[TIGR02330] 2-methylcitrate dehydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0000282165
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTACCC AAGAACTGAA CATCCGCCCG GAATTTGACC GCGAAATCGT CGATATCGTG 
GATTACGTGA TGAACTACGA CATCACCTCA AAGGTGGCGT ACGACACCGC GCATTATTGC 
CTGCTCGACA CGCTTGGCTG TGGTCTGGAA GCGCTGGAAT ACCCGGCCTG TAAAAAATTG 
CTTGGGCCGA TCGTGCCAGG CACGGTGGTG CCCAACGGCG CACGCGTGCC GGGCACCCAG 
TTTCAGCTCG ATCCGGTACA GGCAGCCTTT AACATTGGCG CGATGATCCG CTGGCTCGAT 
TTTAACGATA CCTGGCTTGC CGCCGAGTGG GGCCATCCTT CTGATAACCT CGGCGGTATT 
CTGGCGATTG CGGACTGGCT GTCACGCAAC GCCGTCGCCG CCGGCAAAGC GCCGCTGACC 
ATGAAACAGG TATTGAGCGG GATGATCAAA GCCCATGAAA TTCAGGGTTG CATCGCGCTG 
GAAAACGCCT TCAACCGTGT CGGGCTTGAC CATGTGCTGC TGGTGAAAGT GGCCTCGACT 
GCGGTGGTCG CTGAAATGCT GGGGCTGACG CGCGATGAGA TCCTTAACGC GGTATCGTTG 
GCGTGGGTGG ATGGGCAGTC GTTGCGCACT TATCGTCATG CGCCGAATAC CGGTACGCGC 
AAATCCTGGG CGGCGGGCGA TGCGACTTCG CGCGCGGTAC GTCTGGCGCT GATGGCGAAA 
ACCGGCGAGA TGGGTTATCC CTCGGCGCTC ACCGCCAAAA CCTGGGGCTT CTACGACGTT 
TCATTCAAAG GTGAAACGTT CCGTTTCCAG CGTCCTTACG GCTCCTACGT GATGGAAAAC 
GTGCTATTCA AAATTTCTTT CCCGGCAGAA TTCCACTCGC AAACCGCCGT CGAAGCGGCG 
ATGACGCTGT ATGAGCAGAT GCAGGCCGCG GGTAAAACGG CAGCGGATAT CGAGAAAGTG 
ACCATCCGCA CCCACGAAGC CTGTCTCCGC ATTATCGATA AAAAAGGCCC GCTCAATAAC 
CCGGCGGACC GCGATCACTG TATCCAGTAT ATGGTCGCCG TGCCGCTGCT GTTCGGGCGG 
TTAACCGCGG CGGATTATGA AGACGAGGTG GCGCAGGACA AGCGTATTGA CGCCCTGCGC 
GAGAAGATCG TGTGTTATGA GGACCCGGCT TTTACCGCCG ACTATCACGA CCCGGAAAAA 
CGTGCTATCG GCAATGCGAT CACCGTGGAG TTTACTGATG GCTCACGCTT TGGCGAGGTT 
GTCGTGGAGT ATCCGATTGG TCATGCGCGT CGCCGCGCCG ACGGTATTCC GAAGCTTATC 
GAAAAATTTA AAATTAACCT GGCGCGTCAG TTCCCGACTC GCCAGCAGCA ACGCATTCTG 
GATGTCTCCC TGGACAGAGC CCGCCTGGAG CAGATGCCGG TTAACGAATA CCTCGATTTA 
TATGTCATCT GA

Protein sequence

MSTQELNIRP EFDREIVDIV DYVMNYDITS KVAYDTAHYC LLDTLGCGLE ALEYPACKKL 
LGPIVPGTVV PNGARVPGTQ FQLDPVQAAF NIGAMIRWLD FNDTWLAAEW GHPSDNLGGI 
LAIADWLSRN AVAAGKAPLT MKQVLSGMIK AHEIQGCIAL ENAFNRVGLD HVLLVKVAST 
AVVAEMLGLT RDEILNAVSL AWVDGQSLRT YRHAPNTGTR KSWAAGDATS RAVRLALMAK 
TGEMGYPSAL TAKTWGFYDV SFKGETFRFQ RPYGSYVMEN VLFKISFPAE FHSQTAVEAA 
MTLYEQMQAA GKTAADIEKV TIRTHEACLR IIDKKGPLNN PADRDHCIQY MVAVPLLFGR 
LTAADYEDEV AQDKRIDALR EKIVCYEDPA FTADYHDPEK RAIGNAITVE FTDGSRFGEV 
VVEYPIGHAR RRADGIPKLI EKFKINLARQ FPTRQQQRIL DVSLDRARLE QMPVNEYLDL 
YVI