Gene Shew_2155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew_2155
Symbol
ID	4923327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella loihica PV-4
Kingdom	Bacteria
Replicon accession	NC_009092
Strand	+
Start bp	2499904
End bp	2500944
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	640163740
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_001094280
Protein GI	127513083
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.759615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.638305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCG AACAAAATCC ACTGGGATTA CTGGGCATCG AATTTACCGA GTTTTGCACC 
CCAGATCTCG ACTTTATGCA CAAGGTCTTT ATCGACTTTG GTTTCTCTAA GCTGAAGAAG 
CATAAGCAAA AAGATATCGT TTACTACAAG CAAAACGACA TCAACTTCCT GCTAAACAAC 
GAGAAGAGCG GCTTCTCTGC CGAGTTTGCC AAGAAGCACG GCGCTGCCAT CAGCTCTATG 
GGCTGGCGCG TAGAAGATGC CAAATTCGCC TTCGAGGGTG CGGTTGCCCG TGGCGCCAAG 
CCTGCAGGTG ATGAGGTGAA AGACCTGCCC TATCCGGCCA TCTACGGCAT CGGCGATAGC 
CTGATCTACT TTATCGACAC CTTCGGCGCG GACAACAACA TCTACGCCAC CGACTTTGTC 
GATCTTGAAA ACCCAGAAAT CGTACAAGAG AAAGGCTTTA TCGAAGTCGA CCACCTGACC 
AACAACGTCT ACAAAGGCAC CATGGAGCAT TGGTCGAACT TCTACAAAGA TATCTTCGGC 
TTTACCGAGG TACGCTACTT CGACATCAAG GGTTCGCAGA CGGCACTGAT CTCTTATGCC 
CTGCGTTCAC CCGATGGCAG CTTCTGCATC CCAATCAACG AAGGTAAAGG CGACGACAGA 
AACCAGATCG ACGAGTATCT GAGAGAATAC GACGGCCCAG GCGTGCAGCA TCTGGCGTTC 
CGCAGCCGCG ACATCGTTGC CTCATTGGAT GCGATGGAAG GTAGCTCGAT TCAGACCCTG 
GATATCATCC CTGAATACTA CGACACCATC TTCGATAAGC TGCCACAGGT AACCGAAGAC 
AGAGAGCGCA TCAAGCATCA CCAGATCCTG GTGGACGGTG ACGAGGACGG CTATCTGCTG 
CAGATCTTCA CCAAGAACCT GTTTGGTCCT ATCTTCATCG AGATCATTCA GCGTAAGAAC 
AACCTGGGCT TCGGCGAAGG TAACTTCAAG GCACTGTTCG AATCAATCGA GCGTGACCAG 
GTGCGTCGCG GCGTACTCTA A

Protein sequence

MASEQNPLGL LGIEFTEFCT PDLDFMHKVF IDFGFSKLKK HKQKDIVYYK QNDINFLLNN 
EKSGFSAEFA KKHGAAISSM GWRVEDAKFA FEGAVARGAK PAGDEVKDLP YPAIYGIGDS 
LIYFIDTFGA DNNIYATDFV DLENPEIVQE KGFIEVDHLT NNVYKGTMEH WSNFYKDIFG 
FTEVRYFDIK GSQTALISYA LRSPDGSFCI PINEGKGDDR NQIDEYLREY DGPGVQHLAF 
RSRDIVASLD AMEGSSIQTL DIIPEYYDTI FDKLPQVTED RERIKHHQIL VDGDEDGYLL 
QIFTKNLFGP IFIEIIQRKN NLGFGEGNFK ALFESIERDQ VRRGVL