Gene Mmcs_3173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3173
Symbol
ID	4112005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3363807
End bp	3365291
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	64%
IMG OID	638032304
Product	UBA/THIF-type NAD/FAD binding fold
Protein accession	YP_640336
Protein GI	108800139
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCGCGG GTCAACGACT ATGCATCTAT TTGGATCCTT CACGGGAATG GCAGCCGACG 
CTTGGTGTGG CCGGCCTACT CACCCGCCTT TGGGACTGGC TCGTCGACGC GGCCGCCGGA 
AACTTCGACG CCGCCACCGC CATGTACCAC GCTGTTGGCG GAGTGCCGCA TCAGGCACAT 
GACACACCGA CGATCGTTAC CCGAGAACCC GGACCGGCGA AGCGCCACCA AACGGCTCAC 
CTGATCGCCC GGTCAACGCA CCGATACGAC CTGACGTACT CGCCTGGAGC TGCCGGGCAT 
CGCGTACCGG TAATTACCCT GGCCACCGCG CTGCCGTTCG GTGCCGCATC CACATTCGCG 
CTACTGCTTG CTCTCCTGGA CGACCCCTAC CTTGACCGCC TCGAAGGACG GGCTCCCCGG 
ATCGCACCGC AATCGCCGGC GTTCCTCACC GCCCTCCTGG CGAGTGCGTT ACGAAATCAC 
CACGACGCCG AGCAATACTT CGTCCTCGCC GTGCCGCACC CCGCTGGAGG CCCACCCCAC 
CTCTTGGGCG GACGGCTCCC CACCCCAACG GCGAATGCGC TCCGCGAGGT CGCGCAGCAA 
CGGGGTGTGG GGGTTGTTCT CGACCCCGCG AAGATCAACA CTGAAATCCC GATTGAGTGG 
TGCAGGATGT CCGACGAACG ACCCGAAGTG ACAACCCGCC GCGACGACGG CCGCCCCGTG 
AACGGATTTC AACGAAAGAC TGTCCACATC TGGGGCTGCG GCGGGCTCGG ATCATGGATC 
GCCGAATTCA TCGCTCGCGC AGGAGCATCG GAGATCACCG TGTGCGACCC TGGCATCGTC 
ACCGGCGGCT TGCTCGTCCG ACAAAACTAC GTCGAAGACG ACATTGGCCG TTCCAAAGCC 
GAGGCACTCG CTGGACGGCT CCGCGCGATC CGTGATGACC TGACGGTCAC CGTCGCAGAA 
GGGCACCTCC CAGAAGACCA CACGTCATGC CTGGCAGCGG ATCTCATCAT CGACGCCACA 
GTGAACAACG GCATCACGAG CTGTCTCGAT GCGTTGGCAA CTGCGCCGAC GCGAAAGGCA 
TTGATCGCTC AGGTCGCCAC AGACGCTCGC TCTGGCACGC TCGGCCTAGC CGTGCTGTGC 
GCCGCAAGCG CAACAGCGAC AGTTTCCAGC ATCGATCAAG ACGCTGGCCG AACAATCCAG 
GGCGACAGCG GACTTGAGCT CTACCACACG CTGTGGCAAG AACCCAGCGA TGACGAACTT 
ATACCAACCA GGGGCTGCTC GGTCCCCACA TTCCACGGCT CGGCAGCCGA CCTCGTAGCG 
GTCGCAGCCA CACTCGTCAA CCTGATCGGA AGCCACCTCC AACAACCGGA CTCCGCGGTT 
TCGGGCACAC ACCTCATCGC TCTGCCGCAC GCGGCCAGCG GCCCCCGACA CCACTTCCTC 
CCCGGTGTAA CGCACCCCAT GGATCACACA GCAGGGACAG AATGA

Protein sequence

MLAGQRLCIY LDPSREWQPT LGVAGLLTRL WDWLVDAAAG NFDAATAMYH AVGGVPHQAH 
DTPTIVTREP GPAKRHQTAH LIARSTHRYD LTYSPGAAGH RVPVITLATA LPFGAASTFA 
LLLALLDDPY LDRLEGRAPR IAPQSPAFLT ALLASALRNH HDAEQYFVLA VPHPAGGPPH 
LLGGRLPTPT ANALREVAQQ RGVGVVLDPA KINTEIPIEW CRMSDERPEV TTRRDDGRPV 
NGFQRKTVHI WGCGGLGSWI AEFIARAGAS EITVCDPGIV TGGLLVRQNY VEDDIGRSKA 
EALAGRLRAI RDDLTVTVAE GHLPEDHTSC LAADLIIDAT VNNGITSCLD ALATAPTRKA 
LIAQVATDAR SGTLGLAVLC AASATATVSS IDQDAGRTIQ GDSGLELYHT LWQEPSDDEL 
IPTRGCSVPT FHGSAADLVA VAATLVNLIG SHLQQPDSAV SGTHLIALPH AASGPRHHFL 
PGVTHPMDHT AGTE