Gene Smed_4768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4768
Symbol
ID	5318492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1290029
End bp	1291540
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	62%
IMG OID	640776566
Product	ABC transporter related
Protein accession	YP_001313498
Protein GI	150376902
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.957059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.347139
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGGTT CCGCCGCGGA CACCATCCTC AAGATCACCG ACGTTACCAA GTCCTTCGGG 
CAGGTCGCTG CCCTCAAGGG GATGCGGCTC GAAGTACGGC GCGGCCGGGT GCACACACTG 
CTCGGTGAGA ATGGTGCCGG CAAATCGACA TTGATGAAGA TTCTCGCCGG CGTGCACACG 
GCAACCTCGG GAGAAATCAC CCTCGACGGG CAGGCTTACC GCCCCGCGAG CCCGCAGGAT 
GCGGCCTCGC TCGGACTTGC CATCGTCTTC CAGGAATTGA GCCTCTGCAA CAATCTCACG 
GTGGCGGAGA ATATCCTCGC CACGCGCGAG CCACGTCGTT TCGGATTCAT CAACGACAAG 
GCGCTCGTCG CACAGGCGCG CCGGATCGTG GCCGACCTTG GACTCCCGAT CGACGTCACC 
GAGAAGGTCG GCAATCTCTC GATCGCCCAA CGGCAGCTCG TCGAGATCGC CAAGGGCCTG 
AGCCACGACG CGGAGGTCGT CATTCTGGAT GAACCGACCT CCTCCCTCAG TGACAGCGAG 
GCGGAGATCC TGTTCGCGAT CATCGCCCGG CTGAAAGAGC GTGGCGTTGC GATCATATAC 
ATCTCGCACC GCATGGAAGA GATCATGCGG CTCAGCGACG ACATCACGGT CATACGCGAC 
GGCGAGTATG TTTCCACGCA TGCGCGCGAA GAGGTGACCA TCGAGGCACT GATCGCCCTG 
ATGGTCGGGC GACGCATGGA CGAGATCTAC CCGCCGGCGG TTCATGCGGT CGCAAGGGAT 
AAGGCCCCTG TCCTTTCAGT CGAGCGCTTG ACACGCGAAG GCGAGTTTCA GGACGTCTCC 
TTCGAGGTAC GCGCTGGCGA GATCCTGGGC TTCTTCGGCC TTGTCGGATC GGGCCGCTCG 
GAAGTGATGA ACGCGATCTT CGGCATGAAA AACGCCAGCG GCGCTGTGCG TCTCAACGGC 
GAGGTCGTGC GGTTCCGCTC GCCGGACGAA GCCATCGCCC GGCGCGTCGG CTTCGTGACA 
GAGAACCGAA AGGAAGAAGG TCTCGTCCTC GGCCACAGCG TCGAGTGGAA CATATCCATG 
GCTGCACTCG GGGACTTCAC CGGTGGTTTC GGTTTCATCC GCAACGGCGC GGAACGAGCC 
GCGGCATCCG CACAGGTCGG CAATCTCTCG ATCAAGACGA ACTCGCTCGA CACGCCATCC 
GGTGCGCTCA GCGGCGGCAA TCAGCAGAAG ATCGTGATTG CCAAATGGCT TCTCACGCGG 
CCCAGAGTGC TGATCCTCGA TGAGCCGACC CGCGGCGTCG ACGTCGGAGC CAAGTTCGAA 
ATCTACAAGA TAATCCGTCA GCTGGCAGCG GAGGGAACGG CAATTCTGTT GATCTCCTCC 
GATCTGCCCG AAGTTCTGGG AATGAGCGAC CGCGTTGTCG TCATGCATGA GGGCGCGCCG 
GGAGCGACGC TCGAAGGCCC CGACCTCACT CCAGAGACGA TCATGGCTCA CGCGACAGGT 
TTTCAATCAT GA

Protein sequence

MHGSAADTIL KITDVTKSFG QVAALKGMRL EVRRGRVHTL LGENGAGKST LMKILAGVHT 
ATSGEITLDG QAYRPASPQD AASLGLAIVF QELSLCNNLT VAENILATRE PRRFGFINDK 
ALVAQARRIV ADLGLPIDVT EKVGNLSIAQ RQLVEIAKGL SHDAEVVILD EPTSSLSDSE 
AEILFAIIAR LKERGVAIIY ISHRMEEIMR LSDDITVIRD GEYVSTHARE EVTIEALIAL 
MVGRRMDEIY PPAVHAVARD KAPVLSVERL TREGEFQDVS FEVRAGEILG FFGLVGSGRS 
EVMNAIFGMK NASGAVRLNG EVVRFRSPDE AIARRVGFVT ENRKEEGLVL GHSVEWNISM 
AALGDFTGGF GFIRNGAERA AASAQVGNLS IKTNSLDTPS GALSGGNQQK IVIAKWLLTR 
PRVLILDEPT RGVDVGAKFE IYKIIRQLAA EGTAILLISS DLPEVLGMSD RVVVMHEGAP 
GATLEGPDLT PETIMAHATG FQS