Gene Shewmr4_0097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_0097
Symbol
ID	4250976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	106986
End bp	108212
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	52%
IMG OID	638116639
Product	imidazolonepropionase
Protein accession	YP_732235
Protein GI	113968442
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTGGG ATCAGGTTTG GATAGACGTT AACGTAGCAA CAATGGACCC TTCCATATCA 
GCACCTTACG GCGCAATTAC CAATGCAGCT ATCGCAGTAA AAGACGGTAA AATTGCCTGG 
TTAGGCCCAC GCAGCGAGCT GCCCGCCTTC GATGTGTTGT CCATTCCTGT TTACAGGGGC 
AAGGGCGGTT GGATCACTCC TGGGCTGATT GATGCCCACA CCCATCTGGT ATTTGCCGGT 
AATCGTGCCA ACGAATTCGA GCTACGCCTA AAGGGCGCTA CCTATGAGGA AATCGCCCGT 
GCTGGCGGCG GCATTATTTC CACGGTTAAC GCCTGCCGTG AGGCCGACGA AGCCGAGTTA 
TTTGATCTCG GCCGCCAACG TTTAAATGCC TTGGCGAAGG AAGGTGTCAC TACGGTTGAG 
ATTAAATCTG GCTATGGTCT AGATACCGAA ACCGAACTCA AAATCCTGCG TGTTGCCCGC 
GAACTCGGCC AACATCACCA TGTGGATGTG AAGACCACCT TCCTCGGTGC CCATGCGGTG 
CCGCCCGAGT TTAAAGACAA TAGCGACGGC TATGTCGACT TAATAATCAA TAAAATGCTG 
CCTGCGGTGA TTGCCGAAAA TCTTGCCGAT GCGGTGGATG TATTCTGTGA AAACATCGCC 
TTTAACCTAG AGCAAACCGA GCGCGTGCTG AGCGCCGCCA AAGCGGCTGG CCTGCAAGTC 
AAACTGCACG CCGAGCAATT ATCCAATATG GGCGGCTCTG AATTAGCCGC ACGCTTAGGG 
GCTAAGTCGG TTGATCATAT TGAATATTTA GATGAGGCTG GTGTTAAAGC CCTAAGTGAA 
AGTGGCACCT GCGCCGTGCT GTTACCGGGC GCGTTTTACT TTTTGCGGGA AACCCAAAAA 
CCACCTATCG ACTTATTGCG TCAATACGGT GTGCCTATGG TGCTCGCCAG CGACTTTAAT 
CCCGGCTCAT CGCCCATCTG TTCGACCCTG CTGATGCTGA ACATGGGTTG CACCCTATTC 
CGCTTAACAC CAGAGGAAGC GCTTGCGGGT TTAACATTGA ATGCCGCCAA GGCACTAGGG 
ATTGAAGAGA ATGTCGGCAG CTTGGTGGTT GGTAAGCAGG CGGATTTCTG TCTGTGGGAT 
ATCGCCACCC CGGCGCAACT CGCCTATAGC TACGGCGTGA ATCCCTGCAA GGATGTGGTG 
AAAAACGGTA AGTTAGTGCA TCAATAA

Protein sequence

MSWDQVWIDV NVATMDPSIS APYGAITNAA IAVKDGKIAW LGPRSELPAF DVLSIPVYRG 
KGGWITPGLI DAHTHLVFAG NRANEFELRL KGATYEEIAR AGGGIISTVN ACREADEAEL 
FDLGRQRLNA LAKEGVTTVE IKSGYGLDTE TELKILRVAR ELGQHHHVDV KTTFLGAHAV 
PPEFKDNSDG YVDLIINKML PAVIAENLAD AVDVFCENIA FNLEQTERVL SAAKAAGLQV 
KLHAEQLSNM GGSELAARLG AKSVDHIEYL DEAGVKALSE SGTCAVLLPG AFYFLRETQK 
PPIDLLRQYG VPMVLASDFN PGSSPICSTL LMLNMGCTLF RLTPEEALAG LTLNAAKALG 
IEENVGSLVV GKQADFCLWD IATPAQLAYS YGVNPCKDVV KNGKLVHQ