Gene Shewmr4_0476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_0476
Symbol
ID	4250900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	541423
End bp	542484
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	56%
IMG OID	638117035
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_732613
Protein GI	113968820
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTGCC GACTAACACA ATTGTTTGGG ATCCAGTTTC CGATTATTCA AGCCCCGATG 
GCGGGCGTGC AGGGTAGTGC ACTGGCGATT GAAGTATCGC AGGCAGGTGG ATTGGGCTCC 
TTGCCCTGCG CCATGTTATC CCTCGAGGCG CTTGAGGCTG AGTTAACCGA AATCCGCAGC 
AATACCACTA AACCTATCAA TGTAAATTTC TTTTGCCATA GTGAGCCTTT AGCGCAGGCG 
GCCAAGCAAG CGGCTTGGCT TGAACAGCTC TCGCCTTATT TTACTGAATT TAATTTCGAT 
CCGAATGCGC AGCCCGCTGG CGCCCAGCGC ACCCCCTACA GCAAGGCGCA GGCCGAGGTG 
TTAGCCAAAT TTAAGCCCGA GGTGGTGAGT TTTCATTTTG GGCTGCCCGA TGAAGAATTG 
CTGCTGGAAA TCAAATCCTG GGGCTCAAAA GTTATCTCCA CGGCGACTAC AGTCGAGGAG 
GCTCTTTGGC TCGAGGCCCG TGGCGCCGAT GCGATTATTG CCCAAGGTCT AGAGGCGGGC 
GGGCACAGAG GGCACTTTTT ATCCGAGGAT TTAACCGAGC AGCAGGGGAC TTTTAGTCTA 
TTACCGCAGG TGATTGCGGC AGTGGATATT CCGGTGATTG CCGCCGGCGG CATTGTCGAT 
GCCACTACAG TGCGCGCCGC CATGGCGATG GGCGCTTCGG CGGTGCAAGT GGGAACAGCC 
TATTTACTCT GCCCCGAGTG CAATACCAGC AGCATCCATC GTGAGGCGCT GCAAAGCGAC 
GCCGCGCAGC ATACGGCACT GACTAATTTA TTTTCCGGTC GACCCGCTCG CGGCATAGTG 
AACCGCTTTA TGGCCGAGAT GGGGCCGATG AATGAAGCTG TGCCAGATTT CCCCTTGGCA 
TCCTCGGCCG TTGCAGGCTT AAGAACGGCG GCGGAGCAAC AAGGATTTGG CGATTTTAGT 
CCGCTATGGT GCGGCCAAAA TGCCAGTGGT TGCCGAAACA TTCCCGCAGC CGAGCTGACG 
AGGCAGTTGG CTTTAGGTGT GATGGGAGCA TTATCTGGCT GA

Protein sequence

MPCRLTQLFG IQFPIIQAPM AGVQGSALAI EVSQAGGLGS LPCAMLSLEA LEAELTEIRS 
NTTKPINVNF FCHSEPLAQA AKQAAWLEQL SPYFTEFNFD PNAQPAGAQR TPYSKAQAEV 
LAKFKPEVVS FHFGLPDEEL LLEIKSWGSK VISTATTVEE ALWLEARGAD AIIAQGLEAG 
GHRGHFLSED LTEQQGTFSL LPQVIAAVDI PVIAAGGIVD ATTVRAAMAM GASAVQVGTA 
YLLCPECNTS SIHREALQSD AAQHTALTNL FSGRPARGIV NRFMAEMGPM NEAVPDFPLA 
SSAVAGLRTA AEQQGFGDFS PLWCGQNASG CRNIPAAELT RQLALGVMGA LSG