Gene Smed_4487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4487
Symbol
ID	5319179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	971781
End bp	972911
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	65%
IMG OID	640776288
Product	FAD dependent oxidoreductase
Protein accession	YP_001313220
Protein GI	150376624
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGAAG TTTTGATCGT GGGCGGCGGC ATCATGGGCC TGTGGGCCGC TGTGATGGCT 
GGGCGCGCCG GCTTTACGAC GCGGCTTCTC GAGCGATGGC GGATCGGTTC CGGCGCGAGC 
GGCGGTTTCC TCGGCGCGCT CATGCCGCAT ATGCCTGACC GTTGGAACGA GAAGAAGCAG 
TTTCAGTTCG ATGCCCTGGT GTCGCTCGAA GGCGAGATCG CCGAGCTTGA AGCCGCAACC 
GGCCTCTCGG CAGGCTACCG CCGCTCCGGT CGGGTCATGC CCATTGGGAG AGCACATCTG 
CGCGAGATCG CCCACGGCCG TGAGCGGGAT GCGGCACAGA ATTGGCGAGG GCCGGCACAC 
CAATACCTTT GGCAGGTCGG CCACGCCGAT GAAGGCGGTT GGCCGGCCGC CGATGCGGCG 
CCCTTCGGTA TCGTCCAGGA CACGCTGGCC GCGCGGGTGG CGCCACGCAA CCTTCTTGCG 
GTGCTGCGTG CCGCACTGGA CCAATTTCCG CATGTTCAAT GCGAGGAAGG TGCGGAAGTC 
GTCTCGATCG AGCCGGCACG CGGCCGGCTT TTGCTCGCGG ACGGGCGCGC TTTGACCTTC 
GATCGCCTGA TCCTCGCCGC CGGCGTCGCA AGCTTCGGCT TCATCGATGG TCTGACACAG 
CCCAGGCGGT CTGCAAGCGG CGGTGCCGTC AAGGGCCAGG CAGCGCTGTT TCGCGCCGAT 
GTCGACAAAG CCTTGCCGAT CATCTTTACC GAAGGGCTTT ATATCGTTCC GCACGAAAAC 
GGACAGGTGG CGGTCGGCAG CACGAGCGAA AGCCGGTTCG ACGACCCCAA TTTTACCGAT 
CGTCAGCTTG ATGCCCTGCT TGCGCGCGCA ATCGATATCG CGCCCGTTTT GCGTAGCGCC 
ACGGTAATCG AACGCTGGGC GGGCCTGCGT CCCAGGGCGA CAGGGCTCGA GCCCATGGTT 
GGTCGTCACC CGGATCACGA AAGGCTTTTC GTCTTGACCG GGGGCTTCAA GGTGAGCTTC 
GGGCTGGCGC ATGCATTGGC ACGATCCGTG GTGGAAGAGA TCGCCGGCGG CGGCATGAAC 
GCCTTGCCTG AGAGCTTTCA ATGTGCGCAT CACGTCGCCG CCCTGCGCTA G

Protein sequence

MCEVLIVGGG IMGLWAAVMA GRAGFTTRLL ERWRIGSGAS GGFLGALMPH MPDRWNEKKQ 
FQFDALVSLE GEIAELEAAT GLSAGYRRSG RVMPIGRAHL REIAHGRERD AAQNWRGPAH 
QYLWQVGHAD EGGWPAADAA PFGIVQDTLA ARVAPRNLLA VLRAALDQFP HVQCEEGAEV 
VSIEPARGRL LLADGRALTF DRLILAAGVA SFGFIDGLTQ PRRSASGGAV KGQAALFRAD 
VDKALPIIFT EGLYIVPHEN GQVAVGSTSE SRFDDPNFTD RQLDALLARA IDIAPVLRSA 
TVIERWAGLR PRATGLEPMV GRHPDHERLF VLTGGFKVSF GLAHALARSV VEEIAGGGMN 
ALPESFQCAH HVAALR