Gene Smed_4026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4026
Symbol
ID	5318326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	484435
End bp	486075
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	63%
IMG OID	640775834
Product	ABC transporter related
Protein accession	YP_001312767
Protein GI	150376171
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.393631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.697509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCA CACATCTTCT CGAGGTCAAG GACCTGACCG TCGATTTCCT GTCGCTTGGC 
GGATCCTTCC GCGCGACAAA CGGCGTCAGC TTCCATGTCG ATGCCGGAGA GACGCTCGTG 
ATCCTGGGCG AGTCCGGTTC CGGCAAATCG GTAAGCGCCA GTGCGATCAT GGGACTCATC 
GACACGCCTC CCGGCGACAT CTGCGCGGGG TCGGTCGCCT ATCGCGGCCG CGATCTCTCC 
TCGCTTTCGG AAGGTGAGCG GCGGGACCTC AACGGCCGCA AGATCGCGAT GATCTTCCAG 
GACCCGCTTT CGCATCTGAA CCCGGTCTAT ACGATCGGCT GGCAGATGGA GGAGGTGTTC 
AGCGTCCACG GAGTGGCGAG CGGTGGCGTG GCGCGGCAGA GGGCGATCGA TATATTGAGG 
CGCGTCGGCA TCCCGGAGCC GGAGAAGCGC ATCGACCAGT ATCCGCACCA ATTCTCCGGC 
GGCCAGCGCC AGCGCATCAT GATCGGCATG GCAATCGCGC TCAGGCCGGA AATCCTGATC 
GCCGACGAGC CGACGACAGC GCTCGACGTG AGCGTGCAGG CCCAGATTCT CGAGCTTCTG 
AAGAAGCTGC AGGCGGAGGA CGGCCTTGCC ATCATCATGA TCACCCACGA CCTCGAGGTG 
GCCGCGAACA TGGCCGACAG GGTGATCGTC ATGAAATCCG GCCGCATCGT GGAAGAGGGC 
GAGGCCCGTG CGGTCTTCGA AAACCCCGCC CATACCTATA CGCGGACGCT GATCAACGCG 
CTACCGCATG GCGATCACGA AGCCCCGCCG AAACGCGGAA GGCCCGCTGG AAAGCCGATC 
CTGGAAGTAA GGAACATCGA CAAGTTCTAC ACTCTCTCCT CCGGGTTTTT CGCGAAACCG 
GCGCGGTTGC ACGCGGTCAA GAAGTTGAGC TTCGACGTTG CGGCAGGGGA GACCATCGGC 
ATAGTTGGCG AGAGCGGCTC CGGCAAGTCC ACCGTCGCGC GCGTGCTTCT GGGTCTCAAC 
GAAGCGTCCG GCGGAGAGGC GCTGTTCCAC GGGCGCGATA TCCTGAAGAT GGACCGCAAG 
GAATTGCTGG CCTTCCGCCG GAAGGTGCAG ATGGTTTTTC AGGATCCCTA CAGCTCGATG 
AACCCGCGCA TGACGGTGCT CGATATCGTT TCGGAGCCGT GGCGCATCCA CAAGGATATT 
CTGGAGAAGC CCCGTTGGCG CGACCGCGTT ACTGAATTGC TGGGGCTCGT CGGCCTGAAC 
CCCGAGCATG CCGCACGCTA TCCTCATCAG TTCTCAGGGG GGCAGCGGCA GCGCATCGCC 
ATTGCCCGGG CGCTTGCCTG CGATCCGGAG CTCGTCGTGT GCGACGAGGC CGTGTCGGCG 
CTCGACGTCT CGGTGCAGGT GCAGGTGATC GGCCTCTTGG CGGAATTGCG CGACCGGCTG 
GGCCTCGCCT ACATTTTCAT AACCCATGAC CTGCCGATCG TGCGTCACTT CGCCGACCGG 
ATCATCGTCA TGAAGAGCGG CGAGATCGTC GAGCATGCGA CGACGGAAGA GATCTTCCGC 
AGTCCGCAGC ATGCCTATAC GCGCCAGCTC ATCAATGCGA CGCCGAAGCC GAAGTGGCAG 
ACAGCCGCCG ACGCGGCATG A

Protein sequence

MTGTHLLEVK DLTVDFLSLG GSFRATNGVS FHVDAGETLV ILGESGSGKS VSASAIMGLI 
DTPPGDICAG SVAYRGRDLS SLSEGERRDL NGRKIAMIFQ DPLSHLNPVY TIGWQMEEVF 
SVHGVASGGV ARQRAIDILR RVGIPEPEKR IDQYPHQFSG GQRQRIMIGM AIALRPEILI 
ADEPTTALDV SVQAQILELL KKLQAEDGLA IIMITHDLEV AANMADRVIV MKSGRIVEEG 
EARAVFENPA HTYTRTLINA LPHGDHEAPP KRGRPAGKPI LEVRNIDKFY TLSSGFFAKP 
ARLHAVKKLS FDVAAGETIG IVGESGSGKS TVARVLLGLN EASGGEALFH GRDILKMDRK 
ELLAFRRKVQ MVFQDPYSSM NPRMTVLDIV SEPWRIHKDI LEKPRWRDRV TELLGLVGLN 
PEHAARYPHQ FSGGQRQRIA IARALACDPE LVVCDEAVSA LDVSVQVQVI GLLAELRDRL 
GLAYIFITHD LPIVRHFADR IIVMKSGEIV EHATTEEIFR SPQHAYTRQL INATPKPKWQ 
TAADAA