Gene Mkms_5750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5750
Symbol
ID	4610259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008703
Strand	-
Start bp	259923
End bp	260948
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	639789406
Product	extracellular solute-binding protein
Protein accession	YP_935741
Protein GI	119855136
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.177697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.666773
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCCC GTCGGAGTCG TTGGAGTCGA ATCACCGCAC TGGGGGCCGC CGTCGCGCTG 
GCAGTCGGTC TCACCGCCTG CTCGTCGTCG GAGGAAGAGG ACGGCCTGCT GATCTACAAC 
GCGCAGCACG AGTCGCTGAC CAAGGAGTGG ATCGACGCCT TCACCAAGGA AACCGGCATC 
AAGGTCACCT ACCGCCAAGG CGGCGACACC GAACTGGGCA ACCAGCTGAT CGCCGAAGGC 
GACTCATCGC CCGCCGACGT GTTCCTCACC GAGAACTCCC CCGCCATGGC CGCCGTCGAG 
AAGGACGGCC TATTCACCGA CGTCGACCAG GCCACCATCT CCCAGGTGCC ACCGCAATTC 
CGCCCCACCA CCAGCAAGTG GACCGGCGTC GCCGCCCGCA CCACCGTGTT CGCCTACGAC 
AAGACCAAGC TCACCGAGGC ACAGCTGCCC CGGTCGATCA TGGATCTGGA GAAGCCCGAG 
TGGAAGGGCC GCTGGGGCGC CCCGCCGGTC AAGCCCGACT TCCAGGCCAT CGTCGCCGCA 
ATGCTCGAAC TCACCGGTGA GCAGGCCACC AGCGCGTGGC TGTCCGCCAT GAAGGCGAAC 
GCCGAGATCT ACTCCGACAA CATCGCCACC TTGCGCGCGG TCAACGACGG CCAGGTCGAG 
GGCGGGATCA TCTACCACTA CTACTGGTTC CGCGATCAGT CGCAGACCAA GGAGATCTCG 
GGCAACACCG CACTGCACTA CTTCCGCAAC CAAGACCCCG GCGCCTTCGT CTCGATCTCC 
GGCGGCGGCA TCCTGAACTC CAGCAAGAAG AAGGAAGACG CCCAGAAGTT CCTCACCTAC 
GTCACCAGCA AAGCTGGTCA GGAAGTGCTC GAGAACGGAA CCTCGTTCGA ATACCCCGTC 
GCCAGCGGCG TGCCTGCCAA CCCCGCGCTG GTGCCGCTGG CCGGCCTGCA AGCACCCGCC 
GTCAACCCGT CGAACCTCAA CGCGCAGAAG GTCACCGACC TGATGACGAA GGCGGGCCTG 
CTCTAG

Protein sequence

MSARRSRWSR ITALGAAVAL AVGLTACSSS EEEDGLLIYN AQHESLTKEW IDAFTKETGI 
KVTYRQGGDT ELGNQLIAEG DSSPADVFLT ENSPAMAAVE KDGLFTDVDQ ATISQVPPQF 
RPTTSKWTGV AARTTVFAYD KTKLTEAQLP RSIMDLEKPE WKGRWGAPPV KPDFQAIVAA 
MLELTGEQAT SAWLSAMKAN AEIYSDNIAT LRAVNDGQVE GGIIYHYYWF RDQSQTKEIS 
GNTALHYFRN QDPGAFVSIS GGGILNSSKK KEDAQKFLTY VTSKAGQEVL ENGTSFEYPV 
ASGVPANPAL VPLAGLQAPA VNPSNLNAQK VTDLMTKAGL L