Gene Smed_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1149
Symbol
ID	5321995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1220069
End bp	1221439
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	64%
IMG OID	640790090
Product	TolC family type I secretion outer membrane protein
Protein accession	YP_001326835
Protein GI	150396368
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01844] type I secretion outer membrane protein, TolC family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.435165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTCGA TTGTCCGCAA AGCAGCCTTG TGGGCGGCTG TCTCGACCAG TGTGCTGCTC 
GCGCCCCATG CCGTTCTCGC GGAGACGATT TTCGGGGCGA TGGCCAAGGC CTATGCGAAC 
AACCCGGATC TCAATGCCGC TCGCGCCGGG TTGCGGGCTA CGGATGAAGG GGTTCCGATC 
GCGAAGTCAG GCTTTCGGCC GCAGATTTCC GCATCCGCGA CGGGAACCCT GACGCGGCTC 
GACCAGGAAA AAAGTCGGGC GCAAGACCTT CATGCCGGGC AGGTAGGCAT CTCCATCACG 
CAGATGATCT TCGATGGATT TCAGACGCTG AACAATGTCC GCGCCGCCGA AGCGGAGGTT 
TTTTCGAGTC GCGAAACGCT GAAGGCCAAT GAGATTCAGA TCCTGCTTTC GGCCGCGCAA 
TCCTATGCTA ACATCGCACG CGACCAGCAG ATCGTTTCCA TCCGCCGGCA GAACCTGGCC 
TTCCTCAGGG AGCAGCTGAA CGCAGCGCAG GCCCGCCTCG ATGTGGGCGA GGGCACGCGG 
ACCGATGTGA GCCAGGCGCA GGCGGAACTC GCCAACGCTC AGTCGCTGCT CGTCGCTGCC 
GTCGCGCAGC TGAAGCAGAG CGAGGCGGTT TATGTGCAGA TCGTCGGCGC GGCGCCGACC 
GGCATCAGGC AGCCGGGGCC TGCGACCAAG GCCATGCCAA GGTCGCTCGA CCAGGCCGTT 
GCGACCGGGC TGCGCGAAAA CCCGCAAATC CTGGCGGCTC AATATGCCGT CGATTCGGCC 
GGCTATCAGG TCAAGTCCGC CGAAGGCACG ATGTTGCCCG GCGTCGTCCT CCAGGGCGCC 
GTAACGCGCA ACACCGGAAA TGCCGGTCAG GGGCTTGATG ACACGACCGC GAGTGTCACG 
GCCCGGCTCG AAGTTCCGAT TTATCAGGGC GGTGCGGAAT ATGGTCAGAT TCGCCAAGCC 
AAGGAAATAC TCGGACAGCA GCGGATCCTC GTCGACTCTG CACGCGCTTC GGTGCAGCAG 
ACCGTCGTCT CGGCCCATGC GCAGCTCGAA TCCGCGCTCG CCAGAATCCG AGCCAGCAGG 
TCGCAGATCT CCGCCGCGAA CCTGGCGCTG GAGGGCGTGA TCGAAGAACG CAAGGTCGGC 
CAGCGCACGA CACTGGATGT GCTCGATGCA CAGCAGGACG TTCTGGATGC GCAGGAGTCG 
CTGGCCGGGG CGCAGCGTGA TGCCGTGGTT GCCAGTTATG CCCTGCTCGC CGCAATGGGG 
CACCTCACCG TCAGGAGTCA GGGCCTCCAG GTGGCTGAAT ACCGGGCCGA GGAACACTAC 
GAGGCCGTCA AGGACAAGTG GTTCGGACTG CGTACCGTCG ACGGACGCTA G

Protein sequence

MVSIVRKAAL WAAVSTSVLL APHAVLAETI FGAMAKAYAN NPDLNAARAG LRATDEGVPI 
AKSGFRPQIS ASATGTLTRL DQEKSRAQDL HAGQVGISIT QMIFDGFQTL NNVRAAEAEV 
FSSRETLKAN EIQILLSAAQ SYANIARDQQ IVSIRRQNLA FLREQLNAAQ ARLDVGEGTR 
TDVSQAQAEL ANAQSLLVAA VAQLKQSEAV YVQIVGAAPT GIRQPGPATK AMPRSLDQAV 
ATGLRENPQI LAAQYAVDSA GYQVKSAEGT MLPGVVLQGA VTRNTGNAGQ GLDDTTASVT 
ARLEVPIYQG GAEYGQIRQA KEILGQQRIL VDSARASVQQ TVVSAHAQLE SALARIRASR 
SQISAANLAL EGVIEERKVG QRTTLDVLDA QQDVLDAQES LAGAQRDAVV ASYALLAAMG 
HLTVRSQGLQ VAEYRAEEHY EAVKDKWFGL RTVDGR