Gene Mmcs_3454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3454
Symbol
ID	4112286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3664503
End bp	3665813
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	638032589
Product	hypothetical protein
Protein accession	YP_640617
Protein GI	108800420
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0757862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGAC TTCCCCAACT CATCGGAGTG ATCGCGCTCG TCGCGTTCGG TGGGCTGTTC 
GCGGCTATCG ACGCCGCGCT GAGCACGGTG TCCATGGCCC GGGTCGAGGA ACTCGTACGC 
GAGGAACGGC CGGGAGCCGT GCGGTTGCAG CGGGTGATGC ACGAACGGCC CCGCTACATC 
AACCTCATCG TGCTGCTGCG GATCGCCTGC GAGGTGACCG CGACTGTGCT GCTCGCCGCC 
TACCTGGACG GCCACCTCGG CGTGAGCTGG GGACTGACCG CGGCCGCGGC CATCATGGTG 
GTCGCCAGCT TCGTCGCCGT CGGCGTCGGG CCGCGCACCG TCGGGCGCCA GAACGCCTAT 
CCCATCGCGC TGTACACCGC GCTTCCGCTG CAGGCCATCT CGGTGCTGCT CACCCCGATC 
AGCCGCCTGC TGGTGTTGAT CGGCAACGCG CTGACCCCCG GCCGCGGATT CCGCAACGGG 
CCGTTCGCCT CGGAGATCGA ACTGCGTGAG GTCGTCGACC TGGCGCAGCA GCGCGGCGTG 
GTGGCCGACG ACGAGCGCCG GATGATCCAG TCGGTGTTCG AACTCGGCGA CACCGCGGCC 
CGCGAGGTGA TGGTGCCGCG CACCGAGATG GTGTGGATCG AAAGTGACAA GACAGCCGGC 
CAGGCCACCT CACTCGCGGT CCGCAGCGGA CACTCCCGCA TCCCCGTCAT CGGGGAGAAC 
GTCGACGACG TGGTCGGCGT GGTGTACCTG AAAGACCTCG TCCAGCAGAC GTATTACTCG 
GTCAACGGCG GCCGCGACAC CACCGTCGCG CAGGTCATGC GCGATCCGGT GTTCGTGCCG 
GACTCCAAAC CGCTCGACGA ACTGCTGCGT GAGATGCAGC GCGACCGCTA CCACATGGCG 
CTGCTGGTCG ACGAGTACGG CGCCATCGCC GGGCTGGTCA CCATCGAGGA CGTCCTCGAG 
GAGATCGTGG GTGAGATCGC CGACGAGTAC GACACCGACG AGGTGGCGCC GGTCGAAGAA 
CTCGGCAACC GGGAGTACCG GGTGTCCGCG CGGCTGCCCA TCGAGGACCT CGGCGAGCTC 
TACGACATCG AGTTCGGTGA GGATCTCGAC GTCGACACCG TCGGCGGTCT GGTCGCCTTC 
GAACTCGGGC GCGTACCGCT GCCCGGCGCC GAGATCACCT GGGACGGCCT GCGGCTCAAG 
GCCGAAGGCG GCCCCGACCA TCGCGGCCGG GTGCGCATCG GCACCGTCCT GGTCAGCCCC 
ACCGAGCCAG AGCACGACGA CGAGACCGAA CCCGAGGAGC GCGGTGACTG A

Protein sequence

MSGLPQLIGV IALVAFGGLF AAIDAALSTV SMARVEELVR EERPGAVRLQ RVMHERPRYI 
NLIVLLRIAC EVTATVLLAA YLDGHLGVSW GLTAAAAIMV VASFVAVGVG PRTVGRQNAY 
PIALYTALPL QAISVLLTPI SRLLVLIGNA LTPGRGFRNG PFASEIELRE VVDLAQQRGV 
VADDERRMIQ SVFELGDTAA REVMVPRTEM VWIESDKTAG QATSLAVRSG HSRIPVIGEN 
VDDVVGVVYL KDLVQQTYYS VNGGRDTTVA QVMRDPVFVP DSKPLDELLR EMQRDRYHMA 
LLVDEYGAIA GLVTIEDVLE EIVGEIADEY DTDEVAPVEE LGNREYRVSA RLPIEDLGEL 
YDIEFGEDLD VDTVGGLVAF ELGRVPLPGA EITWDGLRLK AEGGPDHRGR VRIGTVLVSP 
TEPEHDDETE PEERGD