Gene Mmcs_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1788
Symbol
ID	4110622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1928983
End bp	1929981
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	65%
IMG OID	638030908
Product	Rieske (2Fe-2S) region
Protein accession	YP_638953
Protein GI	108798756
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.651662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTC CGTTCACCTG GAAGGTCACC GGGTGGTTCA TGGTCGGGTG GTCGGCGGAA 
TTCGTCTCCG GCGAGACGCG GGCGCTGCAC TACTTCGGCG ACGATCTGGT CGCCTACCGG 
GACGAGTCGG ACACCCTGCA TGTCCTGGAG GCGCACTGCA AACACCTCGG TGCGCATCTC 
GGCCACGGCG GAAAGGTGGT CGGCGACTGC GTGGAGTGCC CGTTCCACGG CTGGCGCTGG 
GGTCCACAGG GCGACAACAC CTACATCCCC TATCAACCCG ACCGGCCGAA CCGGGCACTG 
AAGCTGAGGG TGTACCCCGT CGTCGAGCAG TACGGCTGCG TCTTCGTCTG GCACCATCCC 
GACGGCGCGC CACCGCAGTG GCCGCTGCCG GACCTGTTCG AGAAGTTCCC CCAGTTCCCC 
ACCGACCCGG ATGCGTACTA CCGGCCGTAT CCCGAGTTCT CCAGCCGCGC CGAGAACGAA 
CCGGTGCACC CGCAGATCGT CGCCGAGAAC GGCCCGGACA GTTCACACTT CCGCTACGTC 
CACGGCGCCT CGGTGACGCC GGTCTGCCTG AACTGGGAGG TGGTCGGTGA GGAGTGGCGC 
TTCCTCACCG GCTGGCCGGA TCCGCGCAGC GACGATCCGG ACAAGATGGC GCTGTTCATC 
CATAGCCACT TCTCCGGGCT GGGGTTCGCC GTGAGCGTCT TCGAGGGTTC GTCGAACCAT 
CGGCTGATCT TCGCGTGCAC CCCGGTCGAC GACGGGCTCT CGGACATGTT CTATTCGATC 
TGGTGGCCCA AGGTCGACGG GGAGACCTCC GACGTCCCAC CGGACGATGT CCGCGCCCGG 
GTGGAGAGAC AGTTCCTGCG CACGGTCTGG GAGGATCTCG ACATCTGGCG CTATCAGCGC 
TATGTCGAAC GGCCGCCGCT GGCCAAGATC GACGCGAAAC CGTATATGGC GATGCGGGAG 
TGGGCCAAAC AGTTCTACGA CGTGTCCGCA TCGGTATGA

Protein sequence

MKVPFTWKVT GWFMVGWSAE FVSGETRALH YFGDDLVAYR DESDTLHVLE AHCKHLGAHL 
GHGGKVVGDC VECPFHGWRW GPQGDNTYIP YQPDRPNRAL KLRVYPVVEQ YGCVFVWHHP 
DGAPPQWPLP DLFEKFPQFP TDPDAYYRPY PEFSSRAENE PVHPQIVAEN GPDSSHFRYV 
HGASVTPVCL NWEVVGEEWR FLTGWPDPRS DDPDKMALFI HSHFSGLGFA VSVFEGSSNH 
RLIFACTPVD DGLSDMFYSI WWPKVDGETS DVPPDDVRAR VERQFLRTVW EDLDIWRYQR 
YVERPPLAKI DAKPYMAMRE WAKQFYDVSA SV