Gene Smed_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2117
Symbol
ID	5322977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2180219
End bp	2181868
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	61%
IMG OID	640791055
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_001327785
Protein GI	150397318
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.129596
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.211481
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTC AGTTCATCTA TCACATGGCC GGGCTCAACA AGGCCTATGG CAACAAGAAG 
GTCCTCGAGA ACATCCATCT CTCGTTCTAT CCGGAAGCGA AGATCGGCAT TCTCGGCCCG 
AACGGGGCCG GTAAGTCGAC CGTGCTCCGG ATCATGGCGG GCCTCGATAC CGAATATACC 
GGCGAGGCAT GGGTCGCCGA AGGTGCGAGG GTCGGCTATC TCGCACAGGA GCCTCAGCTC 
GACGCTCAGA AGAACGTGCT CGAGAACGTG ATGGAAGGGG TCGCCGCCAA GAAGGCGATC 
CTCGATCGCT ACAACGAGCT GATGATGAAT TATTCCGACG AGACCGCGGA CGAAGGCGCA 
AGGCTCCAGG ATGTCATCGA TAGCCAGAAC CTATGGGATC TCGACAGCCA GGTGGAGATG 
GCGATGGAAG CCTTGCGCTG CCCGCCGGCG GACGCGGATG TCGCCAATCT GTCCGGTGGC 
GAAAAGCGCC GTGTCGCTCT TTGCAAGCTC CTCCTGTCGC AGCCCGAACT GCTTCTGCTC 
GACGAACCGA CCAACCATCT CGATGCGGAA ACGATCGCCT GGCTCGAGAA GCATCTGCGC 
GAATATCCGG GTGCCGTGCT GATGGTCACT CACGACCGCT ACTTCCTCGA CAACGTCACG 
GGGTGGATTC TCGAGCTCGA CCGCGGCCGG GGAATTCCCT ACGAGGGCAA CTATTCCGCC 
TATCTGCAGT CCAAATCCAA GCGCATGGCC CAGGAAGGGC GCGAAGAGGC TGCCCGCCAG 
AAAGCGATCA GCCGCGAGCA GGAGTGGATC TCATCGAGCC CGAAGGCTCG CCAGGCGAAG 
TCGAAGGCGC GTGTGCGCGC CTATGACGAG CTGGTCAAAG CGGCCGCGGA CCGGCGTCCC 
GGGGACGCGC AGATCATCAT TCCCGTCGGC GAGCGCCTGG GACAGGTCGT CATCGAGGCG 
GAGAATATTT CCAAGGGCTA CGACGACCAG TTGCTGATCG ACGGCCTGAC CTTCAAGCTG 
CCGCCAGGCG GCATCGTCGG CGTCATCGGC CCGAACGGCG CTGGCAAGAC GACGCTCTTC 
CGCATGATCA CCGGCCAGGA GCAGCCGGAC GGCGGTTCCA TCCGCATCGG CGACAGCGTG 
CAGCTCGCCT ATGTCGACCA GAGCCGCGAT GCGCTCGATG CGAATAAGAC TGTCTTCGAA 
GAAATTTCAG GCGGCAACGA CGTCATCAAG CTCGGCAAGC ACGAGGTCAA TGCGCGCGCC 
TACTGCTCGG CCTTCAACTT CAAAGGCGGC GATCAGCAGC AGAAAGTCGG CACGCTTTCC 
GGTGGCCAGC GCAACCGCGT GCACCTTGCA AAGATGCTGA AGTCCGGCGG TAACGTCGTG 
CTGCTCGACG AACCGACCAA CGACCTCGAC ACGGAGACTC TGGCGGCGCT CGAGGATGCT 
CTCGAGAACT TTGCGGGTTG CGCAGTGATC ATCAGCCACG ATCGCATGTT CCTCGACCGT 
CTCGCCACCC ATATCCTCGC CTTCGAGGGC GACAGTCACG TCGAGTGGTT CGAAGGCAAC 
TTCGAGGATT ACGAAAAGGA CAAGATCCGC CGTCTCGGTC CGGACTCGGT CAATCCCAAG 
CGGGTAACCT ACAAGCGCCT GACGCGTTAA

Protein sequence

MARQFIYHMA GLNKAYGNKK VLENIHLSFY PEAKIGILGP NGAGKSTVLR IMAGLDTEYT 
GEAWVAEGAR VGYLAQEPQL DAQKNVLENV MEGVAAKKAI LDRYNELMMN YSDETADEGA 
RLQDVIDSQN LWDLDSQVEM AMEALRCPPA DADVANLSGG EKRRVALCKL LLSQPELLLL 
DEPTNHLDAE TIAWLEKHLR EYPGAVLMVT HDRYFLDNVT GWILELDRGR GIPYEGNYSA 
YLQSKSKRMA QEGREEAARQ KAISREQEWI SSSPKARQAK SKARVRAYDE LVKAAADRRP 
GDAQIIIPVG ERLGQVVIEA ENISKGYDDQ LLIDGLTFKL PPGGIVGVIG PNGAGKTTLF 
RMITGQEQPD GGSIRIGDSV QLAYVDQSRD ALDANKTVFE EISGGNDVIK LGKHEVNARA 
YCSAFNFKGG DQQQKVGTLS GGQRNRVHLA KMLKSGGNVV LLDEPTNDLD TETLAALEDA 
LENFAGCAVI ISHDRMFLDR LATHILAFEG DSHVEWFEGN FEDYEKDKIR RLGPDSVNPK 
RVTYKRLTR