Gene Smed_0265 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0265
Symbol
ID	5321097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	284499
End bp	285686
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	62%
IMG OID	640789200
Product	flagellin domain-containing protein
Protein accession	YP_001325959
Protein GI	150395492
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA TTCTCACCAA CAATTCCGCA ATGGCTGCGC TTTCGACGCT GCGCTCGATC 
TCTTCCAGCA TGGAAGACAC CCAGAGCCGC ATCTCGTCGG GCCTCCGCGT CGGTTCGGCC 
TCCGACAACG CCGCCTACTG GTCGATCGCG ACCACCATGC GTTCCGACAA TCAGGCGCTC 
TCCGCCGTTC AGGACGCCCT TGGCCTCGGC GCCGCCAAGG TTGATACCGC CTATTCCGGT 
ATGGAATCGG CCATCGAAGT CGTTAAGGAA ATCAAGGCCA AGCTCGTCGC CGCCACCGAA 
GACGGTGTCG ACAAGGCGAA GATCCAGGAA GAAATCACCC AGCTGAAAGA CCAGCTCACG 
AGCATTGCCG AGGCGGCTTC GTTCTCCGGC GAAAACTGGC TTCAGGCGGA CCTCAGCGGC 
GGCGCCGTCA CCAAGAGCGT CGTGGGGTCG TTCGTCCGTG ACGCAAGCGG TTCCGTATCT 
GTCAAGAAGG TCGACTACAG CCTCAACGCC AACTCGGTTC TCTTCGATAC TGTCGGCGAC 
ACCGGCATCC TGGACAAGGT CTACGACGTC TCGCAGGCAA GCGTTACGCT GACGGTCAAC 
ACCAACGGCG TCGAATCGCA GCATACTGTT GCTGCCTATT CGCTGGAGTC TCTCACCGAA 
GCCGGTGCGG AGTTCCAGGG CAACTACGCT CTTCAGGGCG GTAACAGCTA CGTCAAGGTC 
GAGAACGTCT GGGTTCGCGC CGAGACCGCT ACAGCCGGTG CCACCGGTCA GGAAATCGCC 
GCCACCACAA CGGCAGCCGG TACCATCACT GCCGACAGCT GGGTCGTCGA CGTTGACAAC 
GCACCTGCCG TCAGCGTTTC GGCCGGTCAG TCCGTTGCCG GGATCAACAT CGTCGGAATG 
GGGGCAGCCG CCCTCGATGC GCTGATCAGC GGTGTCGACG CTGCACTGAC CGACATGACC 
AGCGCTGCCG CCTCGCTCGG CTCCATCTCC TCGCGCATCG ACCTGCAGAG CGAATTCGTC 
AACAAGCTCT CGGACTCGAT CGACTCGGGC GTTGGCCGTC TCGTCGATGC GGACATGAAC 
GAGGAATCGA CCCGCCTCAA GGCTCTGCAG ACCCAGCAGC AGCTCGCCAT TCAGGCCCTG 
TCGATCGCCA ACTCGGACTC GCAGAACGTC CTGTCGCTCT TCCGCTAA

Protein sequence

MTSILTNNSA MAALSTLRSI SSSMEDTQSR ISSGLRVGSA SDNAAYWSIA TTMRSDNQAL 
SAVQDALGLG AAKVDTAYSG MESAIEVVKE IKAKLVAATE DGVDKAKIQE EITQLKDQLT 
SIAEAASFSG ENWLQADLSG GAVTKSVVGS FVRDASGSVS VKKVDYSLNA NSVLFDTVGD 
TGILDKVYDV SQASVTLTVN TNGVESQHTV AAYSLESLTE AGAEFQGNYA LQGGNSYVKV 
ENVWVRAETA TAGATGQEIA ATTTAAGTIT ADSWVVDVDN APAVSVSAGQ SVAGINIVGM 
GAAALDALIS GVDAALTDMT SAAASLGSIS SRIDLQSEFV NKLSDSIDSG VGRLVDADMN 
EESTRLKALQ TQQQLAIQAL SIANSDSQNV LSLFR