Gene Mflv_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_2043
Symbol
ID	4973365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	2121569
End bp	2122963
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	70%
IMG OID	640456252
Product	cystathionine beta-synthase
Protein accession	YP_001133309
Protein GI	145222631
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG0031] Cysteine synthase [COG3620] Predicted transcriptional regulator with C-terminal CBS domains
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.140313
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.388176
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATCG CCCGGCACAT CAGTGAGCTC ATCGGCAACA CCCCCCTGGT TCAGCTGAAC 
TCTGTCGTCC CCCCGGGCGC GGGCACGGTC GTCGCCAAGG TCGAGTACCT CAATCCCGGC 
GGCAGCTCCA AGGACCGCAT CGCGATCAAG ATGATCGACG CGGCCGAGGC CAGCGGCGAG 
CTGAAGCCCG GCGGCACCAT CGTCGAGCCC ACCTCCGGCA ACACCGGCGT CGGCCTCGCC 
ATCGTCGCCC AGCAGCGCGG GTACAAGTGC ATCTTCGTCT GCCCCGACAA GGTCAGCGAG 
GACAAGCAGA ACGTGCTGCG GGCCTACGGC GCCGAGGTCG TGGTGTGCCC GACGGCCGTC 
GCCCCCGACG ATCCCGCCAG CTACTACTCC GTCTCCAACC GCCTCGTCTC GGAGATCGAC 
GGCGCCTGGA AACCCGACCA GTACTCCAAC CCGATGGGGC CGGAGAGCCA CTACGAGACC 
ACGGGCCCCG AGATCTGGGC CGACACCGAC GGCAAGATCA CCCACTTCGT CGCCGGCGTC 
GGCACCGGCG GCACGATCAC CGGCGCCGGG CGCTACCTCA AAGAGGTCTC CGGTGGCCGC 
GTCAAGGTCA TCGGCGCCGA CCCCGAGGGG TCGGTCTATT CCGGCGGCAC CGGACGTCCC 
TACCTGGTGG AAGGCGTCGG TGAGGACTTC TGGCCGTCGG CGTACGACCC GTCGGTGCCC 
GACGAGATCA TCGCCGTCTC GGACGCCGAC TCCTTCGACA TGACGAGGCG GCTGGCACGC 
GAGGAGGCGC TGCTTGTCGG CGGTTCCTGC GGCATGGCGG CGGTCGCGGC GATCCGGGTC 
GCCGAGCGGG AAGGCCCCGA CGCGCTGGTG GTGGTATTGC TGCCCGACGG CGGACGCGGC 
TACCTGTCGA AGATCTTCAA CGACGGATGG ATGTCGTCCT ACGGGTTCCT GCGCACCAGG 
CTCGACGGAT CGGTCCAGGA ATCCACCGTC GGCGACGTCC TGCGCGGCAA GTCCGGCGCC 
CTGCCGGCAC TGGTCCACAC GCACCCGTCG GAGACGGTCC GCGACGCGAT CGGCATCCTG 
CGCGAATACG GCGTCTCCCA GATGCCGGTG GTGGGTGCCG AACCGCCGGT GATGGCCGGT 
GAGGTCGCCG GCAGCGTGTC CGAGCGCGAT CTGGTGTCCG CGGTCTTCGA GGGCCGGGCC 
AAGCTCGCCG ACGCGGTCGC CCAGCACATG AGCCCGCCGC TGCCACTGAT CGGCGCGGGC 
GAACTCGTCA GCGCGGCAGC CAAGACGCTG CGCGAATGCG ACGCGGTGAT GGTGGTCGAG 
GAGGGCAAAC CGGCAGGCGT GCTCACCCGC CACGACCTGC TCGGATATCT GTCCGACTCC 
TCGCCGGGCC ACTGA

Protein sequence

MRIARHISEL IGNTPLVQLN SVVPPGAGTV VAKVEYLNPG GSSKDRIAIK MIDAAEASGE 
LKPGGTIVEP TSGNTGVGLA IVAQQRGYKC IFVCPDKVSE DKQNVLRAYG AEVVVCPTAV 
APDDPASYYS VSNRLVSEID GAWKPDQYSN PMGPESHYET TGPEIWADTD GKITHFVAGV 
GTGGTITGAG RYLKEVSGGR VKVIGADPEG SVYSGGTGRP YLVEGVGEDF WPSAYDPSVP 
DEIIAVSDAD SFDMTRRLAR EEALLVGGSC GMAAVAAIRV AEREGPDALV VVLLPDGGRG 
YLSKIFNDGW MSSYGFLRTR LDGSVQESTV GDVLRGKSGA LPALVHTHPS ETVRDAIGIL 
REYGVSQMPV VGAEPPVMAG EVAGSVSERD LVSAVFEGRA KLADAVAQHM SPPLPLIGAG 
ELVSAAAKTL RECDAVMVVE EGKPAGVLTR HDLLGYLSDS SPGH