Gene EcolC_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1868
Symbol
ID	6064451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2068682
End bp	2069725
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	641601281
Product	selenophosphate synthetase
Protein accession	YP_001724843
Protein GI	170019889
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000994537
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000520996
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCGAGA ACTCGATTCG TTTGACCCAA TACAGCCACG GAGCTGGTTG CGGCTGTAAA 
ATTTCCCCAA AAGTGTTGGA AACCATCCTG CACAGTGAGC AGGCGAAGTT TGTTGATCCG 
AATTTGCTTG TGGGTAATGA AACCCGCGAC GATGCGGCGG TGTACGATCT GGGCAATGGC 
ACCAGCGTTA TCAGTACCAC CGACTTCTTT ATGCCGATCG TTGATAATCC TTTCGATTTT 
GGCCGCATTG CGGCGACTAA CGCCATCAGC GATATCTTCG CGATGGGGGG CAAACCGATT 
ATGGCGATTG CGATCCTCGG CTGGCCGATT AACAAACTTT CCCCGGAAAT TGCCCGCGAA 
GTGACCGAAG GTGGACGCTA TGCATGTCGT CAGGCGGGTA TTGCGCTGGC TGGCGGTCAC 
TCCATCGATG CGCCGGAGCC GATTTTTGGT CTGGCGGTAA CGGGGAGCGT ACCGACCGAG 
CGGGTGAAGA AAAACAGTAC CGCACAAGCC GGATGCAAAC TGTTCCTGAC GAAACCGCTG 
GGGATCGGCG TTCTTACCAC GGCTGAGAAA AAATCACTGT TGAAACCAGA ACATCAGGGA 
CTGGCGACGG AAGTGATGTG CCGGATGAAC ATCGCAGGCG CGTCCTTTGC CAACATCGAA 
GGCGTAAAAG CGATGACCGA CGTTACGGGC TTTGGTCTGC TGGGCCACTT GAGCGAAATG 
TGTCAGGGGG CTGGTGTGCA GGCACGCGTC GACTATGAAG CGATCCCGAA ACTCCCCGGT 
GTTGAAGAGT ACATTAAGTT GGGCGCAGTA CCTGGCGGCA CTGAACGTAA CTTTGCCAGC 
TACGGTCATC TGATGGGTGA AATGCCGCGT GAAGTGCGCG ATCTGCTGTG CGATCCGCAA 
ACATCTGGCG GTTTGCTGCT GGCGGTCATG CCGGAAGCAG AAAATGAGGT CAAAGCTACA 
GCCGCCGAGT TTGGCATTGA ACTGACGGCA ATTGGCGAAC TGGTGCCAGC GCGCGGCGGT 
CGTGCCATGG TTGAGATTCG TTAA

Protein sequence

MSENSIRLTQ YSHGAGCGCK ISPKVLETIL HSEQAKFVDP NLLVGNETRD DAAVYDLGNG 
TSVISTTDFF MPIVDNPFDF GRIAATNAIS DIFAMGGKPI MAIAILGWPI NKLSPEIARE 
VTEGGRYACR QAGIALAGGH SIDAPEPIFG LAVTGSVPTE RVKKNSTAQA GCKLFLTKPL 
GIGVLTTAEK KSLLKPEHQG LATEVMCRMN IAGASFANIE GVKAMTDVTG FGLLGHLSEM 
CQGAGVQARV DYEAIPKLPG VEEYIKLGAV PGGTERNFAS YGHLMGEMPR EVRDLLCDPQ 
TSGGLLLAVM PEAENEVKAT AAEFGIELTA IGELVPARGG RAMVEIR