Gene SeD_A2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2049
Symbol	selD
ID	6874553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1980975
End bp	1982018
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	58%
IMG OID	642785163
Product	selenophosphate synthetase
Protein accession	YP_002215829
Protein GI	198243320
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.25484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.757262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC AAGCCATTCG TTTAACGCAA TACAGCCACG GCGCTGGTTG CGGTTGTAAA 
ATTTCCCCTA AAGTGCTGGA GACTATCCTG CATAGCGAGC AGGCGAAGTT CGTCGACCCG 
AACCTGCTGG TGGGTAATGA AACCCGCGAT GATGCGGCGG TTTACGATCT GGGTAATGGC 
ACCAGTATCA TCAGCACCAC CGACTTCTTT ATGCCGATAG TCGACAACCC GTTTGATTTT 
GGCCGCATTG CGGCAACAAA CGCCATCAGC GATATTTTTG CGATGGGCGG CAAACCGATT 
ATGGCGATCG CGATCCTTGG CTGGCCGATT AACACCCTGT CGCCCGATAT TGCGCGTGAA 
GTGACCGAGG GGGGGCGCTT TGCCTGCCGT CAGGCCGGTA TCGCGCTGGC GGGCGGACAC 
TCTATTGACG CCCCGGAGCC GATCTTTGGT CTCGCGGTCA CAGGCGTAGT GCCGACCGAA 
CGGGTGAAGA AAAACAGTAC CGCGCAGGCG GGATGCAAAC TCTTTCTGAC CAAACCGTTG 
GGGATTGGCG TGTTGACCAC CGCCGAGAAA AAATCGCTGC TTAAACCTGA ACATCAGGGG 
CTGGCGACGG AAGTCATGTG TCGGATGAAC GTTGCTGGCG CGGCGTTTGC CAATATCGAC 
GGCGTAAAAG CTATGACTGA CGTTACCGGT TTTGGCCTGC TGGGGCACCT GAGCGAGATG 
TGCCAGGGCG CAGGCGTGCA GGCGCTGCTT TGCTATCAGG ACATCCCTAA ACTGCCGGGC 
GTGGAAGAGT ATATTGCTCT GGGCGCCGTA CCGGGCGGCA CAGAGCGCAA CTTCGCCAGC 
TATGGTCATC TGATGGGCGA CATGTCGCGT GAAGTTCGTA GCCTGCTGTG CGATCCGCAA 
ACGTCAGGCG GTCTGTTGTT GGCGGTAACG CCGGACGCCG AAGACGATGT TAAAGCCACC 
GCGGCGGAAT TTGGTATCGA TCTGACCGCG ATTGGCGAAC TGGTCGAGGC CCGCGGCGGT 
CGCGCTATGG TTGAGATTCG TTAA

Protein sequence

MSEQAIRLTQ YSHGAGCGCK ISPKVLETIL HSEQAKFVDP NLLVGNETRD DAAVYDLGNG 
TSIISTTDFF MPIVDNPFDF GRIAATNAIS DIFAMGGKPI MAIAILGWPI NTLSPDIARE 
VTEGGRFACR QAGIALAGGH SIDAPEPIFG LAVTGVVPTE RVKKNSTAQA GCKLFLTKPL 
GIGVLTTAEK KSLLKPEHQG LATEVMCRMN VAGAAFANID GVKAMTDVTG FGLLGHLSEM 
CQGAGVQALL CYQDIPKLPG VEEYIALGAV PGGTERNFAS YGHLMGDMSR EVRSLLCDPQ 
TSGGLLLAVT PDAEDDVKAT AAEFGIDLTA IGELVEARGG RAMVEIR