Gene EcHS_A1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1848
Symbol	selD
ID	5591032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1865047
End bp	1866090
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	640920992
Product	selenophosphate synthetase
Protein accession	YP_001458544
Protein GI	157161226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.000400465
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGA ACTCGATTCG TTTGACCCAA TACAGCCACG GAGCTGGTTG CGGCTGTAAA 
ATTTCCCCAA AAGTGTTGGA AACCATCCTG CACAGTGAGC AGGCGAAGTT TGTTGATCCG 
AATTTGCTTG TGGGTAATGA AACCCGCGAC GATGCGGCGG TGTACGATCT GGGCAATGGC 
ACCAGCGTTA TCAGTACCAC CGACTTCTTT ATGCCGATCG TTGATAATCC TTTCGATTTT 
GGCCGCATTG CGGCGACTAA CGCCATCAGC GATATCTTCG CGATGGGGGG CAAACCGATT 
ATGGCGATTG CGATCCTCGG CTGGCCGATT AACAAACTTT CCCCGGAAAT TGCCCGCGAA 
GTGACCGAAG GTGGACGCTA TGCATGTCGT CAGGCGGGTA TTGCGCTGGC TGGCGGTCAC 
TCCATCGATG CGCCGGAGCC GATTTTTGGT CTGGCGGTAA CGGGGATCGT ACCGACCGAG 
CGGGTGAAGA AAAACAGTAC CGCACAAGCC GGATGCAAAC TGTTCCTGAC GAAACCGCTG 
GGGATCGGCG TTCTTACCAC GGCTGAGAAA AAATCACTGT TGAAACCAGA ACATCAGGGA 
CTGGCGACGG AAGTGATGTG CCGGATGAAC ATCGCAGGCG CGTCCTTTGC CAACATCGAA 
GGCGTAAAAG CGATGACCGA CGTTACGGGC TTTGGTCTGC TGGGCCACTT GAGCGAAATG 
TGTCAGGGGG CTGGTGTGCA GGCACGCGTC GACTATGAAG CGATCCCGAA ACTCCCCGGT 
GTTGAAGAGT ACATTAAGTT GGGCGCAGTA CCTGGCGGCA CTGAACGTAA CTTTGCCAGC 
TACGGTCATC TGATGGGTGA AATGCCGCGT GAAGTGCGCG ATCTGCTGTG CGATCCGCAA 
ACTTCTGGCG GTTTGCTGCT GGCGGTCATG CCGGAAGCAG AAAATGAGGT CAAAGCTACA 
GCCGCCGAGT TTGGCATTGA ACTGACGGCA ATTGGCGAAC TGGTGCCAGC GCGCGGCGGT 
CGTGCCATGG TTGAGATTCG TTAA

Protein sequence

MSENSIRLTQ YSHGAGCGCK ISPKVLETIL HSEQAKFVDP NLLVGNETRD DAAVYDLGNG 
TSVISTTDFF MPIVDNPFDF GRIAATNAIS DIFAMGGKPI MAIAILGWPI NKLSPEIARE 
VTEGGRYACR QAGIALAGGH SIDAPEPIFG LAVTGIVPTE RVKKNSTAQA GCKLFLTKPL 
GIGVLTTAEK KSLLKPEHQG LATEVMCRMN IAGASFANIE GVKAMTDVTG FGLLGHLSEM 
CQGAGVQARV DYEAIPKLPG VEEYIKLGAV PGGTERNFAS YGHLMGEMPR EVRDLLCDPQ 
TSGGLLLAVM PEAENEVKAT AAEFGIELTA IGELVPARGG RAMVEIR