Gene Smed_2338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2338
Symbol
ID	5323199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2415116
End bp	2416183
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	62%
IMG OID	640791276
Product	hemin-degrading family protein
Protein accession	YP_001328005
Protein GI	150397538
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGA CTGAGAGCAT GCGCCCCACC CCTGCTGAAA TCCGTGCCTA TCGCGCTGAA 
AACCCCAAGC TTCGCGAGCG CGACATTGCT GCGCAGCTCG GCATTTCGGA GGCAGCGCTG 
GTCGCTGCCG AATGCGGTCT CACCGCCATC CGAATCGAAT CCAGCGCCAA CCGCTTCCTT 
GAACGCGCCG AAGAACTGGG CGAGGTCCTT GCGCTGACCC GCAATGAAAG CGCCGTCCAC 
GAAAAGGTCG GACTCTACGA GAACGTAAAG CAGGGGCACG CCGCGACGCT GGTACTTGGG 
TCCGAAATCG ACCTGCGCGT CTTCCCTGGC GCCTGGGAAC ACGGCTTCGC CGTTACAAAA 
ACCGATGCCA AGGGGGAGGT TCGCCGCAGC CTGCAGTTTT TCGACAAATG GGGCAACGCG 
GTGCACAAGG TCCACTTGCG CCCTGCATCG CATCTCGCGG CCTACGAGAA GCTTGTTGAA 
GACCTTCGCC TTGACGACCA ATCGCAAGAC TTCATTGCCG ATCCAGGCGC GCCTGCAAAC 
GACGACGTGA CCGATGACTC GGTCGATACG GCAGAGCTGC GCGATCGCTG GTCGAAGCTC 
ACCGACACGC ATCAGTTCCC GGGCATGTTG AGAAAGCTCA AGGTCGGTCG GCGCCGGGCG 
CTGCATTCGA TCGGCGACGA CTTCGCCTGG CGCCTCGACA CCGCCAGCGT CGAAACGATG 
ATGCGCAGTG CCGCAGAAAC GGCGCTGCCG ATCATGTGCT TCGTAGGCAA TCGCGGGGTC 
ATCCAGATCC ACTCCGGTCC GGTCGTGAAG ATCGGGACGA TGGGGCCGTG GCTGAACGTC 
ATGGACGAAA CTTTCCATCT GCATCTGCGC ACCGACCACA TCACCGAACT GTGGGCCGTG 
CGCAAGCCGA CGGCGGACGG ACATGTGACA TCCGTCGAGG GGCTCGACGC CAAGGGCGAG 
ATGATCATTC AGTTCTTCGG AAAGCGGAAG GAAGGGTCCT CGGAAAGGGC CGAATGGCGC 
AGCCTGGCCG AGGGACTGCC GCGTCTGAAG ACCGTCGTCG CGGCCTGA

Protein sequence

MTMTESMRPT PAEIRAYRAE NPKLRERDIA AQLGISEAAL VAAECGLTAI RIESSANRFL 
ERAEELGEVL ALTRNESAVH EKVGLYENVK QGHAATLVLG SEIDLRVFPG AWEHGFAVTK 
TDAKGEVRRS LQFFDKWGNA VHKVHLRPAS HLAAYEKLVE DLRLDDQSQD FIADPGAPAN 
DDVTDDSVDT AELRDRWSKL TDTHQFPGML RKLKVGRRRA LHSIGDDFAW RLDTASVETM 
MRSAAETALP IMCFVGNRGV IQIHSGPVVK IGTMGPWLNV MDETFHLHLR TDHITELWAV 
RKPTADGHVT SVEGLDAKGE MIIQFFGKRK EGSSERAEWR SLAEGLPRLK TVVAA