Gene Smed_3818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3818
Symbol
ID	5318010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	271574
End bp	272788
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	640775630
Product	hypothetical protein
Protein accession	YP_001312563
Protein GI	150375967
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAGTA GTGAAATTGC GATTATCGGC GGCGGCCCCG CCGGCCTGAT GGCGGCGGAA 
ATCCTGTCAC GCTCCGGCCA CGCGGTGACG ATCTACGAGG CGATGCCGAG CGCGGCGCGC 
AAATTCCTGC TCGCGGGCAA GTCCGGCCTC AACATCACGC ACTCCGAACA CAGCAAGGCT 
TTTATGCAGC GGTTCGCCGA TGCGTCCGCA AGGCTGCAAC CGGCGCTCGA CGCTTTTGCT 
CCGAAAGACG TTCGCGCCTG GGCGGATGAA CTTGGCGCGG AAACGTTTGT CGGCTCCTCC 
GGGCGCGTCT TTCCGAGAGC CATGAAGGCT TCGCCGCTGC TGCGCGCATG GCTTCGGCGG 
CTGGAGGCGC AAGGCGTCCG GCTCCTCACC CGCCATCGCT GGTCGGGCTT TGCCGAGGAC 
GGTTATGTTT TCGACACGCC GGAGGGCAGG ACGCTCGTGC GTTGCGACGC GGCTCTCATG 
GCGCTCGGCG GCGCGAGTTG GCCCCGGCTC GGATCCGACG CTGCCTGGGT GCCCCCGCTG 
CGGGCAAGAG GCGTACCGAT CAGGGATCTC CGCCCCGCCA ATTGCGGGTT CGACGTCGCA 
TGGAGCGGGG CCTTCCGTGA GCGTTTTGCC GGTCAGGCGC TGAAAGCAGT TACCGCCACA 
TCCGGCGCCG GGACCATCCC GGGTGAATTC GTGATGAGCC GCCACGGCAT CGAAGGCAGC 
CTCGTCTATG CCCACGCGGC TTGCCTGCGC GACCGGCTGG AGCAGGACGG AAAAGCCTCC 
CTCATGCTCG ACCTTGCGCC AGGCAGAACG GCCGAAAGGC TCGCGCGGGA TCTCGCCCGG 
CAGGATCGCA AGGCGAGCCT CTCCAACCGC CTGCGTAAGG GCGCCGGGCT CGACGGTGTG 
AAGGCGGCAT TGCTGCGCGA GCTCTCGCAG GAGGCAACCA GGATAGCTCC GGAGCAACTT 
GCTGCACTTA TCAAGGCCTT GCCCGTTCCA GTGCTTGCGG CGCGGCCGAT CGCGGAGGCG 
ATCTCGTCGG CCGGCGGTGT CCGCCTGGAC GGCGTCGATG AACGCTATAT GGTGAAGGCC 
GTACCCGGCC TCTTCGTCGC CGGCGAGATG CTCGACTGGG AAGCGCCAAC GGGCGGCTAT 
CTCCTTACAG CTTGCTTTGC CACGGGTCGC GCGGCCGCGC GGGGCGTGAA GGCATGGCTG 
GACGCCCGTC CGTGA

Protein sequence

MQSSEIAIIG GGPAGLMAAE ILSRSGHAVT IYEAMPSAAR KFLLAGKSGL NITHSEHSKA 
FMQRFADASA RLQPALDAFA PKDVRAWADE LGAETFVGSS GRVFPRAMKA SPLLRAWLRR 
LEAQGVRLLT RHRWSGFAED GYVFDTPEGR TLVRCDAALM ALGGASWPRL GSDAAWVPPL 
RARGVPIRDL RPANCGFDVA WSGAFRERFA GQALKAVTAT SGAGTIPGEF VMSRHGIEGS 
LVYAHAACLR DRLEQDGKAS LMLDLAPGRT AERLARDLAR QDRKASLSNR LRKGAGLDGV 
KAALLRELSQ EATRIAPEQL AALIKALPVP VLAARPIAEA ISSAGGVRLD GVDERYMVKA 
VPGLFVAGEM LDWEAPTGGY LLTACFATGR AAARGVKAWL DARP