Gene Smed_4469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4469
Symbol
ID	5318171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	950746
End bp	951738
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	62%
IMG OID	640776270
Product	oxidoreductase domain-containing protein
Protein accession	YP_001313202
Protein GI	150376606
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00179754
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTGA GATTTGGTCT TCTCGGCGCC GGACGCATCG GCAAGGTTCA TGCGAAGGCT 
GTCAGCGCCA ATGCCGATGC GCGCCTTGTC GCCGTTGCTG ACGCCTTTCC CGCCGCCGCT 
GAAGCGATCG CCGGCGCCTA TGGCTGCGAA GTCCGTACGA TCGATGCTAT CCAGGCGGGA 
AGCGACATCG ACGCCGTGGT GATCTGCACG CCGACCGACA CCCATGCCGA CCTGATCGAG 
CGCTTCGCGC GCGCCGGAAA GGCTATTTTC TGCGAAAAGC CTGTTGATCT CGATGTCGAA 
CGCGTCAGGG CCTGCCTCAA GGTCGTGTCC GAGACCAAGG CCAAGCTGAT GGTCGGCTTC 
AACCGTCGCT TCGATCCGCA TTTCATGGCC GTACGCAAGG CGATCGACGA CGGACGGATC 
GGTGAAGTCG AGATGGTGAC GATCACCTCG CGCGATCCAG GGGCGCCGCC CGTCGACTAT 
ATCAAGCGCT CGGGCGGAAT TTTCCGCGAC ATGACGATCC ATGATTTCGA CATGGCACGT 
TTCCTCCTTG GCGAGGAGCC GGTTTCCGTC ACCGCGACTG CGGCCGTACT CGTCGACATG 
GCAATCGGCG AAGCCGGCGA CTATGACAGC GTCTCCGTCA TCCTTCAGAC GGCTTCCGGC 
AAGCAGGCGA TCATCTCGAA TTCACGCCGT GCCACCTACG GTTACGACCA GCGTATCGAG 
GTCCACGGCT CCAAGGGCGC AGTCGCCGCG GAAAATCAGC GTCCCGTGTC GATCGAGATC 
GCGACCGTCG ACGGCTACAC GCGCCCGCCG CTGCACGATT TCTTCATGAC GCGCTACACG 
GAAGCCTATG CGAACGAGAT CGAAAGCTTC GTCGCCGCAA TAGAAAAGGG CGCCGAGATC 
GCACCGTCCG GAGAGGACGG ACTTGCAGCG CTCGCGCTCG CCGATGCGGC CGTCCGTTCG 
GTCGCGGAAA AGCGTCAGGT CAGCGTCGCT TGA

Protein sequence

MTVRFGLLGA GRIGKVHAKA VSANADARLV AVADAFPAAA EAIAGAYGCE VRTIDAIQAG 
SDIDAVVICT PTDTHADLIE RFARAGKAIF CEKPVDLDVE RVRACLKVVS ETKAKLMVGF 
NRRFDPHFMA VRKAIDDGRI GEVEMVTITS RDPGAPPVDY IKRSGGIFRD MTIHDFDMAR 
FLLGEEPVSV TATAAVLVDM AIGEAGDYDS VSVILQTASG KQAIISNSRR ATYGYDQRIE 
VHGSKGAVAA ENQRPVSIEI ATVDGYTRPP LHDFFMTRYT EAYANEIESF VAAIEKGAEI 
APSGEDGLAA LALADAAVRS VAEKRQVSVA