Gene Mflv_2678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_2678
Symbol
ID	4973999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	2803992
End bp	2805029
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	640456896
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001133943
Protein GI	145223265
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.433642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAACC CCGTGCGAAA CCTCCTGAAA TCGCCGCCGC GCTGGCGTAC CGCCGCGGCG 
CTCGCGGTCA CGACGACCCT GCTCGCCGCG TGCGGTGGCG GTGCCAGCGA CGTGGCGGGT 
GACAGTGGTG GCAGCGGCAG CGCGGAGACG ACGCTGACCC TGGTCGCGTT CGCGGTGCCC 
GAGCCGGGCT GGTCGAAGGC TGCGCCCGCG TTCTCGGCCA CGGAGGAGGG TGAGGGTGTG 
GAGGTCACCG CGTCCTACGG CGCCTCCGGT GACCAGTCGC GCAGCGTCGA GTCGGGCAAG 
CCGGCCGACG TCGTCAACTT CTCGGTCGAG CCCGACATCA CCCGCCTGGT CAAGGCCGGA 
AAGGTCGACG AGAACTGGAA CGCCGGGCCC AACAAGGGCA TCGCGTTCGG TTCGATCGTC 
ACGTTCGCGG TGCGACCCGG AAACCCGAAG AACATCCGCA CCTGGGACGA TCTGCTGCAG 
CCCGGCATCG AGGTCATCAC GCCGAGCCCG CTGAGTTCGG GCGCCGCCAA ATGGAACCTG 
TTGGCGCCGT ACGCCTATGC CAGCAACGGT GGGCAGAACC CCGAGGCCGG CATCGAGTTC 
GTCAACAAGC TCGTCACCGA GCACGTGAAG CTGCGTCCCG GCTCGGGCCG TGAGGCCACC 
GACGTGTTCC GGCAGGGCAG TGGCGATGTG CTGCTCGCCT ACGAGAACGA GGCGCTGAAC 
TTCGACCTCG AGCACGTCAA TCCCGCGCAG ACCTTCAAGA TCGAGAACCC GACCGCGGTG 
GTCAACACCA GCCGGCACCT GGACAAGGCG CAGGCCTTCG TCGACTTCCA GTTCACCCCG 
GAAGGTCAGA AGCTGTGGGC CGAGGCCGGA TTCCGGCCGG TGGACCCGGC CGTGCAGGCC 
GAGTTCGCCG ACAAGTTCCC GGCGCCCGAA AAGTTGTGGA CCATCGACGA CCTGGGTGGC 
TGGAAGAACG TCGACACCCA GCTGTTCGAC AAGGACAACG GGACCATCAC CAAGATCTAC 
AAGCAGGCCA CTGGATGA

Protein sequence

MLNPVRNLLK SPPRWRTAAA LAVTTTLLAA CGGGASDVAG DSGGSGSAET TLTLVAFAVP 
EPGWSKAAPA FSATEEGEGV EVTASYGASG DQSRSVESGK PADVVNFSVE PDITRLVKAG 
KVDENWNAGP NKGIAFGSIV TFAVRPGNPK NIRTWDDLLQ PGIEVITPSP LSSGAAKWNL 
LAPYAYASNG GQNPEAGIEF VNKLVTEHVK LRPGSGREAT DVFRQGSGDV LLAYENEALN 
FDLEHVNPAQ TFKIENPTAV VNTSRHLDKA QAFVDFQFTP EGQKLWAEAG FRPVDPAVQA 
EFADKFPAPE KLWTIDDLGG WKNVDTQLFD KDNGTITKIY KQATG