Gene Smed_0267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0267
Symbol
ID	5321099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	287475
End bp	288662
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	60%
IMG OID	640789202
Product	flagellin domain-containing protein
Protein accession	YP_001325961
Protein GI	150395494
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA TTCTCACCAA TGTCGCAGCG ATGGCTGCAC TCCAGACCCT GCGCGGCATC 
GACTCCAATA TGGAGGAAAC GCAGGCTCGG GTGTCCTCGG GCCTTCGCGT CGGAACAGCT 
TCGGACAACG CTGCCTACTG GTCGATCGCC ACTACGATGC GTTCGGACAA TATGGCGCTT 
TCCGCCGTTC AGGACGCGCT GGGCCTGGGC GCCGCAAAGG TCGACACAGC CTATGCCGGT 
GTGGAGAATG CGGTCGAGGT CGTGAAGGAA ATTCGTGCCA AACTCGTCGC TGCGACCGAA 
GACGGTGTCG ACAAGGCCAA GATTCAGGAA GAGATCGAAC AGCTCAAGCA ACAGCTGACG 
AGCATTGCAA CGGCCGCTTC CTTCAGCGGC GAAAACTGGC TCCAGGCTGA CATCACCACG 
CCTGTTACGA AGAGCGTAGT GGGTTCCTTT GTCCGCGACT CCTCAGGCGT CGTGTCCGTA 
AAGACGATCG ACTATGTCCT CGACGGCAAC TCAGTCCTCT TCGATACGGT GGGCAATACC 
GGCATTCTGG ACAAGGTCTA TGACGTGTCA GAGTCCAGCG TCACGCTTTC GATCAACACG 
GGCGGCGTTG TTTCCGAGCA TACGGTCGCA GCCTATACCG TTGACGACCT CATCGCCGGC 
GGCGCGGTAT TCCAGAACAA TTATGCGCTT GCGGGCGGCG TCAGCTATGT TCAGGTCGAA 
GGCGCTTGGG TCAGAGCAGT GGCTTCCTCT ACGGTTCCCG GACAGGAGGT TGCTGCGGTG 
ACGACGGCCG CAGCTCCCAT CACCGCCGAT TCCTGGATCG TAGACACGAC TGCTGGGCCG 
GCAGCAAGTG TACCTGCACC CGCATCGGTC GAGAATATCG ACATCACCGA CGCTACCCAG 
GCCGCAAACC TCGATGCCCT GATCAGGGGG GTCGACGAAG CGCTCGAGGA TCTGATCAGC 
GCCACATCGG CTCTCGGATC GATCTCCATG CGCATCGGCA TGCAGGAAGA GTTCGTATCG 
AAGCTCACCG ACTCGATCGA CTCGGGCATC GGCCGCCTCG TAGACGCCGA CATGAACGAG 
GAATCGACCA GGCTCAAGGC GCTGCAGACG CAGCAGCAGC TCGCCATCCA GTCGCTGTCG 
ATCGCCAACA CCAATTCGGA AAACATCCTC CAGCTCTTCC GTCAGTAA

Protein sequence

MTSILTNVAA MAALQTLRGI DSNMEETQAR VSSGLRVGTA SDNAAYWSIA TTMRSDNMAL 
SAVQDALGLG AAKVDTAYAG VENAVEVVKE IRAKLVAATE DGVDKAKIQE EIEQLKQQLT 
SIATAASFSG ENWLQADITT PVTKSVVGSF VRDSSGVVSV KTIDYVLDGN SVLFDTVGNT 
GILDKVYDVS ESSVTLSINT GGVVSEHTVA AYTVDDLIAG GAVFQNNYAL AGGVSYVQVE 
GAWVRAVASS TVPGQEVAAV TTAAAPITAD SWIVDTTAGP AASVPAPASV ENIDITDATQ 
AANLDALIRG VDEALEDLIS ATSALGSISM RIGMQEEFVS KLTDSIDSGI GRLVDADMNE 
ESTRLKALQT QQQLAIQSLS IANTNSENIL QLFRQ