Gene SeD_A2217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2217
Symbol
ID	6873085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2122191
End bp	2123243
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	51%
IMG OID	642785319
Product	hypothetical protein
Protein accession	YP_002215982
Protein GI	198243375
COG category	[R] General function prediction only
COG ID	[COG1054] Predicted sulfurtransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.598434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGTGT TACACAACCG CATCTCTAAT GACGAGCTGA AAGCCAAAAT GCTGGCGGAA 
AGCGAGCCGC GTACGACAAT TTCTTTTTAT AAATATTTCA CTATCGCCTC GCCGCAGCAG 
ACGCGGGACG CGTTGTATCA GGTGTTTACG GCGTTGGACG TTTTTGGTCG TGTTTACCTG 
GCGCATGAAG GCATCAATGC GCAAATCAGC GTGCCGCAAA GCAAGGTCGA GACCTTTCGT 
CAACAGCTTT ATACGTTCGA CCCCGCGCTG GACGGGCTGC GTTTAAATAT CGCGCTGGAG 
GATGACGGAA AGTCATTTTG GGTGCTGCGT ATGAAAGTTC GCGACCGTAT CGTCGCTGAC 
GGAATTGACG ATCCGACTTT TGACGCCAGT AATGTCGGCG ATTATCTGAA GGCGGCAGAT 
GTGAATGCGA TGCTGGACGA TCCTGATGCG GTCTTTATTG ATATGCGCAA CCACTATGAG 
TATGAAGTCG GCCATTTCGA AAATGCTCTG GAAATCCCGG CGGATACGTT TCGTGAACAG 
TTGCCAAAAG CGGTTGAAAT GCTGCGGGAA CATGCAGATA AAAAGATAGT GATGTACTGT 
ACCGGCGGTA TTCGTTGTGA GAAAGCCAGC GCCTGGATGA AACACAACGG TTTCAATAAA 
GTCTGGCATA TTGAGGGTGG CATCATTGAG TACGCCCGTC GCGCGCGCGA GCAGGGGCTT 
CCCGTTCGCT TTATCGGCAA AAACTTTGTA TTTGATGAGC GAATGGGCGA ACGAATCTCG 
GATGAGGTTA TCGCGCATTG CCATCAGTGC GGCGCGCCCT GCGATAGCCA TACCAACTGC 
AAAAATGACG GTTGCCATCT GCTGTTTATC CAGTGTCCGC AGTGCGCCAG TAAATTTAAC 
GGCTGCTGTA GTGAACAATG CTGTGAAGAG TTGGCCTTGC CGGAGGAAGA ACAGCGCCGA 
CGTCGCGCGG GTCGCGAGAA CGGCAATAAA ATTTTTAATA AATCGCGTGG TCGGCTTAAT 
AGCAAACTGA GCATTCCCGA TCCGGCTGAG TAA

Protein sequence

MPVLHNRISN DELKAKMLAE SEPRTTISFY KYFTIASPQQ TRDALYQVFT ALDVFGRVYL 
AHEGINAQIS VPQSKVETFR QQLYTFDPAL DGLRLNIALE DDGKSFWVLR MKVRDRIVAD 
GIDDPTFDAS NVGDYLKAAD VNAMLDDPDA VFIDMRNHYE YEVGHFENAL EIPADTFREQ 
LPKAVEMLRE HADKKIVMYC TGGIRCEKAS AWMKHNGFNK VWHIEGGIIE YARRAREQGL 
PVRFIGKNFV FDERMGERIS DEVIAHCHQC GAPCDSHTNC KNDGCHLLFI QCPQCASKFN 
GCCSEQCCEE LALPEEEQRR RRAGRENGNK IFNKSRGRLN SKLSIPDPAE