Gene Smed_2307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2307
Symbol
ID	5323168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2386897
End bp	2387946
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	640791245
Product	ABC transporter related
Protein accession	YP_001327974
Protein GI	150397507
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR03415] choline ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.77844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CCGTCATTTT CAAGAATGTC GACATCATCT TCGGCAAAAA TCCGCAGATC 
GCAACGCAAA TGGTCGATCA GGGCAAGACG CGGGACGAGA TCGGTGCTGC CACCGGGCTG 
GTCCTGGGGG TCGCCGGCGC TTCGCTGACC ATCAACGAGG GCGAGATTCT CGTTCTGATG 
GGGCTGTCCG GTTCCGGCAA GTCGACGCTG CTCAGGGCCG TCAACGGCCT TGCGCCGGTT 
GTGCGCGGCG AGGTCGAGGT GAAGACCGGG AACGGGGCTC TCAACCCTTA TCGCTGCAAC 
GCCAAGTCTC TGCGGGACTT CCGCATGCAT ACGGTCTCGA TGGTGTTCCA GCAGTTTGCC 
CTTCTGCCGT GGCGAAGCGT GGCGGACAAT GTCGGTTTCG GGCTCGAATT GGCAGGCGTA 
GCCGATGCCG AACGGCGCAA GCGCGTCGAC GAGCAGCTTG AACTCGTCAA TCTTACGCAA 
TGGGCGGATC GCAAGGTCAA CGAACTCTCA GGCGGCATGC AACAGCGCGT CGGCCTTGCC 
AGGGCCTTTG CCACCGGAGC CCCTATCCTT CTGATGGACG AACCGTTCTC GGCACTCGAC 
CCGCTGATCC GCACACGCCT TCAGGACGAA TTGCTCGAAT TCCAGCGGCG GTTAAAAAAA 
ACGATCATCT TCGTCAGCCA CGACCTCGAC GAGGCCTTCC GCATCGGCAA CCGGATCGCC 
ATCATGGAAG GTGGAAGAAT CATCCAGTGC GGAACGCCGC AGGAGATCGT GAGGAGCCCG 
GCAAACCAGT ATGTCGCCGA TTTCGTCCAG CACATGAATC CGATTTCGAT GCTGACGGCG 
AAGGATGTGA TGCAGAGCGG TGTCGGGCGA ACCGCTGCAA GTACCGGCGT CACGGCGACC 
GCAAAGCCAA CCACGCCACT CGTCGATATT CTCGATGCCA TGTCGCGCCA GCCGGGCAGC 
ATAGGTGTGG TCGACAACGG CGCGGTCGTC GGTACTATCG ACGCGCAGAA CATCGTCGAG 
GGACTGACGC GCCACCGCAG CAAAAACTGA

Protein sequence

MTDAVIFKNV DIIFGKNPQI ATQMVDQGKT RDEIGAATGL VLGVAGASLT INEGEILVLM 
GLSGSGKSTL LRAVNGLAPV VRGEVEVKTG NGALNPYRCN AKSLRDFRMH TVSMVFQQFA 
LLPWRSVADN VGFGLELAGV ADAERRKRVD EQLELVNLTQ WADRKVNELS GGMQQRVGLA 
RAFATGAPIL LMDEPFSALD PLIRTRLQDE LLEFQRRLKK TIIFVSHDLD EAFRIGNRIA 
IMEGGRIIQC GTPQEIVRSP ANQYVADFVQ HMNPISMLTA KDVMQSGVGR TAASTGVTAT 
AKPTTPLVDI LDAMSRQPGS IGVVDNGAVV GTIDAQNIVE GLTRHRSKN