Gene Ssed_2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_2687
Symbol
ID	5611834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	+
Start bp	3243301
End bp	3244341
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	46%
IMG OID	640933606
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_001474422
Protein GI	157375822
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.686037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG AACAAAATCC ACTGGGTTTA TTGGGCATAG AATTTACAGA ATTTGCCACC 
CCAGATCTTG ATTTCATGCA TCAAGTGTTT ATTGATTTCG GTTTTTCTAA GCTAAAGAAA 
AGTAAAACTA AAGACATTAG CTACTACAAG CAGAACGACA TTAACTTTTT GCTGAACAAT 
GAAGTTCGCG GCTTTTCGGC AGAGTTCGCT AAGAGTCACG GCCCCGCGAT CTGTTCGATG 
GGCTGGCGTG TAGAAGATGC CCAGTTTGCT TTCGAAGGCG CAGTGGCACG CGGTGCTAAA 
CCTGCAACAG AAGAAAATAA AGACCATCCT TACCCCGCCA TTTACGGTAT TGGCGACAGC 
CTGATCTACT TTATCGACCT GTTCGGCAGT GAAAGTAATA TCTACCAGAA TGATTTCGTC 
GATCTTGAAG AGCCTGTGAT CACTCAGGAG AAAGGCTTTA TCGAAGTCGA TCACCTGACC 
AACAATGTTT ACAAAGGGAC GATGGAACAT TGGGCCAACT TCTACAAAGA TATCTTTGGT 
TTCACCGAAG TGCGCTACTT CGATATTAAA GGGGCCCAAA CGGCCTTAAT CTCTTATGCG 
CTACGTTCAC CCGACGGCAG CTTCTGTATC CCGATTAATG AAGGCAAAGG CAGTGACAAG 
AATCAGATCG ATGAATACCT CAGAGAGTAT GATGGACCCG GCGTTCAACA CCTGGCATTC 
AGAAGCCGGG ATATCGTCGC GTCACTAGAT GCGATGGAAG GTTCATCGAT AAAAACTTTA 
GATATCATCC CCGAGTATTA CGACACCATC TTCGAAAAAT TGCCACAGGT GACAGAAGAC 
AGAGAAAAAA TTAAACATCA TCAGATCTTA GTCGATGGCG ACGAAGAGGG TTACCTGTTA 
CAGATCTTCA CTAAGAACCT GTTCGGCCCC ATCTTTATCG AGATCATTCA GCGCAAGAAT 
AACCTGGGAT TCGGAGAGGG TAACTTTACC GCCCTGTTCC AGTCTATCGA ACGGGATCAA 
CAGCGCCGCG GTGTGCTGTA A

Protein sequence

MASEQNPLGL LGIEFTEFAT PDLDFMHQVF IDFGFSKLKK SKTKDISYYK QNDINFLLNN 
EVRGFSAEFA KSHGPAICSM GWRVEDAQFA FEGAVARGAK PATEENKDHP YPAIYGIGDS 
LIYFIDLFGS ESNIYQNDFV DLEEPVITQE KGFIEVDHLT NNVYKGTMEH WANFYKDIFG 
FTEVRYFDIK GAQTALISYA LRSPDGSFCI PINEGKGSDK NQIDEYLREY DGPGVQHLAF 
RSRDIVASLD AMEGSSIKTL DIIPEYYDTI FEKLPQVTED REKIKHHQIL VDGDEEGYLL 
QIFTKNLFGP IFIEIIQRKN NLGFGEGNFT ALFQSIERDQ QRRGVL