Gene SO_1962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_1962
Symbol
ID	1169722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	-
Start bp	2067510
End bp	2068550
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	44%
IMG OID	637343845
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	NP_717569
Protein GI	24373526
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCG AACTCAATCC ACTGGGCTTA TTAGGTATCG AATTCACCGA ATTCGCCAGC 
TCTGATACTG ATTTTATGCA CAAGGTGTTT ATCGATTTTG GTTTTTCGCT GCTGAAAAAA 
GCCAAAAATA AAGACATTTT GTACTACAAA CAAAATGATA TTAACTTTCT GCTCAACAAG 
CAGCGCGAAG GTTTCTCTGC TAAGTTTGCC AAATCCCACG GTCCTGCCAT TTGCTCCATG 
GGCTGGCGTG TGGAAGACGC GAGCTTTGCT CACCGTGTGG CGGTGGAGCG TGGTGCCAAA 
GCGGCCGATG ATTCGGCTAA AGATCTGCCC TATCCGGCGA TTTATGGCAT TGGCGACAGC 
TTAATTTATT TTATCGACAC CTTTGGTGCC AACAATAATA TCTATGCCAC TGACTTTGAA 
GACTTAAGCG AGCCAGTGAT CACCCAAGAG AAAGGCTTTA TCGAAGTAGA TCACTTAACC 
AATAACGTCT ACAAAGGCAC CATGGAGCAT TGGGCAAACT TCTACAAAAA CATCTTTGGT 
TTTACTGAAG TACGTTACTT TGACATCAGC GGCGTGCAAA CTGCGCTGGT GTCTTATGCC 
CTGCGCTCAC CCGATGGCAG CTTCTGCATT CCGATTAACG AAGGTAAAGG CAACGATAAG 
AACCAAATCG ATGAATACCT GAAGGAATAC AATGGTCCAG GTGTACAACA TTTAGCCTTT 
AGAAGCCGTG ATATCGTCAA ATCCTTGGAT GCGATGGAAG GCAGCTCTAT TCAATGCTTG 
GATATTATTC CTGAATATTA CGACACCATT TTCGATAAAG TCCCGCAAGT GACCGAAAAC 
CGTGATCGCA TCAAGCATCA CCAAATTTTG GTAGATGGTG ACGAATCAGG CTATTTATTA 
CAAATCTTCA CTAAGAACTT GTTTGGCCCG ATCTTTATTG AAATCATTCA ACGCAAGAAC 
AACTTAGGCT TTGGTGAAGG TAACTTTACT GCCCTGTTCC AATCGATTGA ACGGGATCAA 
ATGCGCCGCG GCGTACTGTA A

Protein sequence

MASELNPLGL LGIEFTEFAS SDTDFMHKVF IDFGFSLLKK AKNKDILYYK QNDINFLLNK 
QREGFSAKFA KSHGPAICSM GWRVEDASFA HRVAVERGAK AADDSAKDLP YPAIYGIGDS 
LIYFIDTFGA NNNIYATDFE DLSEPVITQE KGFIEVDHLT NNVYKGTMEH WANFYKNIFG 
FTEVRYFDIS GVQTALVSYA LRSPDGSFCI PINEGKGNDK NQIDEYLKEY NGPGVQHLAF 
RSRDIVKSLD AMEGSSIQCL DIIPEYYDTI FDKVPQVTEN RDRIKHHQIL VDGDESGYLL 
QIFTKNLFGP IFIEIIQRKN NLGFGEGNFT ALFQSIERDQ MRRGVL