Gene SeD_A0879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0879
Symbol
ID	6872088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	872380
End bp	873240
Gene Length	861 bp
Protein Length	286 aa
Translation table	11
GC content	52%
IMG OID	642784074
Product	phosphotransferase
Protein accession	YP_002214749
Protein GI	198244030
COG category	[R] General function prediction only
COG ID	[COG0561] Predicted hydrolases of the HAD superfamily
TIGRFAM ID	[TIGR00099] Cof subfamily of IIB subfamily of haloacid dehalogenase superfamily [TIGR01484] HAD-superfamily hydrolase, subfamily IIB

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.531066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGACAG ACGGAATTAT TACTCTTAAT CTGGAAAAAA TTATGACTGC ACGCGTGATT 
GCCCTCGATT TAGACGGAAC ATTATTAACC CCGCATAAAA CCTTACTCCC CTCCTCGCTT 
GAAGCGCTAT CACGCGCCAA AGAGGCGGGC TTTCAACTTA TCATTGTCAC GGGTCGCCAT 
CACGTTGCTA TTCATCCTTT TTATCAGGCG CTGGCGCTGG AAACACCTGC TATTTGCTGC 
AACGGCACCT ATTTGTATGA TTATCAAGCT AAAACTGTCC TGGATGCCGA TCCTATGCCC 
GTGGATAAGG CGTTGCAGTT GATTGATTTA CTGGATGAGC ATCAGATTCA CGGCCTGATG 
TATGTTGATG ACGCTATGCT TTACGAACAC CCAACCGGTC ACGTCGTGCG TACCTCCCGG 
TGGGCGCAGA CCTTGCCGCC GGAGCAACGT CCGACCTTTA CACAGGTCTC TTCGTTGGCG 
CAGGCGGCGC GCGACGTGAA TGCCGTGTGG AAGTTTGCGC TTACCGATGA AGATATTCCC 
AGGCTACAGC GGTTCGGTCA GCATGTTGAA CAGGCGCTTG GCCTGGAGTG CGAATGGTCA 
TGGCACGATC AGGTGGATAT CGCGCGCAAA GGCAACAGTA AAGGCAAGCG CCTTACCCAG 
TGGATAGAAG CGCAGGGAGG GTCAATGAAA AATGTGATCG CTTTCGGCGA TAACTACAAC 
GACATCAGTA TGCTGGAGGC GGCAGGCACC GGCGTTGCGA TGGGCAACGC CGATGAGGCG 
GTGAAAGCGC GCGCTGACGT TGTGATCGGC GATAACACTA CCGATAGCAT CGCCAAATTT 
ATTTACACCC ACCTACTATA G

Protein sequence

MPTDGIITLN LEKIMTARVI ALDLDGTLLT PHKTLLPSSL EALSRAKEAG FQLIIVTGRH 
HVAIHPFYQA LALETPAICC NGTYLYDYQA KTVLDADPMP VDKALQLIDL LDEHQIHGLM 
YVDDAMLYEH PTGHVVRTSR WAQTLPPEQR PTFTQVSSLA QAARDVNAVW KFALTDEDIP 
RLQRFGQHVE QALGLECEWS WHDQVDIARK GNSKGKRLTQ WIEAQGGSMK NVIAFGDNYN 
DISMLEAAGT GVAMGNADEA VKARADVVIG DNTTDSIAKF IYTHLL