Gene Shewana3_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_0474
Symbol
ID	4476703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	550973
End bp	552034
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	56%
IMG OID	639725008
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_868121
Protein GI	117918929
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTGCC GACTAACACA ATTGTTTGGG ATCCAGTTTC CGATTATTCA AGCGCCGATG 
GCGGGCGTGC AGGGCAGTGC ACTGGCGATT GAAGTATCGC AGGCGGGCGG ATTGGGCTCC 
TTGCCCTGCG CTATGTTATC CCTCGAGGCA CTAGAAGCTG AGTTAACCGA AATCCGAGCC 
AACACCACTA AATCTATCAA TGTGAATTTC TTTTGCCATA GCGAGCCTTT ACCGCAAGCG 
GCCAAGCAAG CGGCTTGGCT CGAACAGTTA GCACCCTATT TTGCGGAATT TAATCTCGAC 
CCAAATGCGC AGCCTGCTGG CGCCCAGCGC ACACCCTACA GCAAGGCGCA GGCTGAGGTG 
TTAGCCAAAT TTAAGCCCGA GGTGGTGAGT TTTCATTTTG GGCTGCCCGA TGAAGAATTG 
CTGCTGGAAA TCAAATCCTG GGGCTCAAAA GTTATCTCCG CGGCGACCAC AGTCGAGGAG 
GCGCTCTGGC TCGAGGCTCG CGGCGCCGAT GCGATTATTG CCCAAGGCTT GGAGGCGGGT 
GGGCATAGAG GGCACTTTTT ATCCGAGGAT TTAACCGAGC AGCAGGGGAC CTTTAGTTTA 
TTACCGCAGG TGATTGCGGC TGTCGATATT CCGGTGATTG CCGCAGGTGG CATTGTCGAT 
GCCACCACAG TGCGCGCTGC CATGGCAATG GGGGCTTCGG CGGTGCAGGT GGGGACAGCT 
TATTTACTCT GCCCCGAGTG CAACACCAGC AGCATTCATC GTGAGGCGCT GCAAAGCGAC 
GCTGCGCAGC ATACGGCACT GACGAACTTA TTTTCTGGTC GACCCGCCCG CGGCATAGTG 
AACCGCTTTA TGGCCGAAAT GGGGCCGATA AATGAGGCCG TGCCAGATTT CCCCTTGGCA 
TCCTCGGCGG TTGCAGGCTT AAGAACGGCA GCGGAGAGGC AAGGATTTGG AGATTTTAGC 
CCGCTATGGT GCGGACAAAA TGCCAGTGGT TGCCAAAACA TTCCCGCAGC CGAGTTGACG 
CGGCAGTTAG CTTTAGGCTT GATGGGGTCA TTATCTGGCT GA

Protein sequence

MPCRLTQLFG IQFPIIQAPM AGVQGSALAI EVSQAGGLGS LPCAMLSLEA LEAELTEIRA 
NTTKSINVNF FCHSEPLPQA AKQAAWLEQL APYFAEFNLD PNAQPAGAQR TPYSKAQAEV 
LAKFKPEVVS FHFGLPDEEL LLEIKSWGSK VISAATTVEE ALWLEARGAD AIIAQGLEAG 
GHRGHFLSED LTEQQGTFSL LPQVIAAVDI PVIAAGGIVD ATTVRAAMAM GASAVQVGTA 
YLLCPECNTS SIHREALQSD AAQHTALTNL FSGRPARGIV NRFMAEMGPI NEAVPDFPLA 
SSAVAGLRTA AERQGFGDFS PLWCGQNASG CQNIPAAELT RQLALGLMGS LSG