Gene SO_0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_0471
Symbol
ID	1168344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	+
Start bp	495533
End bp	496612
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	54%
IMG OID	637342468
Product	dioxygenase
Protein accession	NP_716108
Protein GI	24372066
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTGTC GACTCACGCG ATTATTTGGG ATTGAATTTC CGATTATTCA GGCACCTATG 
GCCGGAGTGC AGGGGAGTGC GCTCGCGATT GCCGTCTCTG AGGCGGGTGG TTTAGGTTCA 
TTACCCTGTG CCATGTTATC CCTTGAGGCG CTCGAGGCTG AATTAACTGC AATACGCTCG 
CAAACCGCTA AACCTATCAA TGTGAACTTT TTCTGCCATC GCGAGCCTGT AGCGCAGGCA 
GCTAAACAAG CCGCTTGGCT TGAACAGTTA GCGCCCTATT TTGCGGAATT TAATCTCGAC 
CCAAACGCGC AGCCTGCTGG CGCGCAGCGC ACACCCTACA GCAAGGCGCA GGCTGAGGTG 
TTAGCCAAGT TTAAGCCCGA GGTGGTGAGT TTCCATTTTG GTTTGCCCGA TGAAGAGTTG 
CTGCTGGAAA TTAAATCTTG GGGCTCAAAA GTTATCTCCA CGGCGACCAC AGTCGAAGAA 
GCGCTCTGGC TCGAAGCCCG TGGCGCGGAT GCGATTATTG CCCAAGGTTT AGAGGCTGGA 
GGCCACAGAG GGCACTTTTT ATCCGAGGAT TTAACCGAGC AGCTCGGCAC TTTTAGTCTA 
TTACCACAGA TTATTGCGGC GGTGGAGATT CCCGTGATAG CCGCAGGCGG CATAGTCGAT 
GCCACCACGG TTCGGGCGGC AATGACAATG GGCGCTTCGG CCGTGCAAGT GGGGACGGCT 
TATTTGCTCT GTCCAGAATG TAATACCAGT GCAATCCATC GTGAGGCGTT GCAAAGTGAC 
GCTGCGCAAC ATACGGCACT GACTAATTTA TTTTCCGGTA GACCTGCGCG TGGCATAGTG 
AACCGTTTTA TGGCAGAAAT GGGACCGATG AATGAGGCTG TGCCTGATTT CCCCTTGGCA 
TCCTCGGCGG TTGCAGGCTT AAGGACAGCG GCGGAGCGAC TAGGATTTTG GGATTTTAGT 
CCGCTATGGT GCGGGCAGAA TGCCAGTGGG TGCCGAGCGA TCCCTGCCGC AGATTTGACT 
AGAAGCTTTG TGCTAAGCTT GCCCTCATCT TGCGTTGAGC CGCAAGAAAA GTCTGGCTAA

Protein sequence

MPCRLTRLFG IEFPIIQAPM AGVQGSALAI AVSEAGGLGS LPCAMLSLEA LEAELTAIRS 
QTAKPINVNF FCHREPVAQA AKQAAWLEQL APYFAEFNLD PNAQPAGAQR TPYSKAQAEV 
LAKFKPEVVS FHFGLPDEEL LLEIKSWGSK VISTATTVEE ALWLEARGAD AIIAQGLEAG 
GHRGHFLSED LTEQLGTFSL LPQIIAAVEI PVIAAGGIVD ATTVRAAMTM GASAVQVGTA 
YLLCPECNTS AIHREALQSD AAQHTALTNL FSGRPARGIV NRFMAEMGPM NEAVPDFPLA 
SSAVAGLRTA AERLGFWDFS PLWCGQNASG CRAIPAADLT RSFVLSLPSS CVEPQEKSG