Gene Mmcs_1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1121
Symbol
ID	4109959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1218185
End bp	1219276
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	67%
IMG OID	638030243
Product	transposase IS116/IS110/IS902
Protein accession	YP_638290
Protein GI	108798093
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTACAG AGCGTACGAG TGTGGGACTG GACGTGCACG CACGTTCGGT AGCAGCAGCT 
GCCATCGACG GCGTGACCGG TGAGGTTCAG CAGACTCGCC TGACCCCATC CCATGAGCAC 
ATCCGGTCGT GGATATCGGG GCTGGCGGGC CCGGTGGCGG TGGCCTACGA GGCTGGTCCC 
ACCGGTTTCG GCTTGCAGCG GTCGTTGACG GAGGCCGGGA TCCGCTGCGT CGTGGTGGCG 
CCGTCGAAAC TGCAGAAGCC CGCTGGAGAT CGAGTGAAGA CCGATGCCCG CGACGCCCTG 
CACCTGTGCC GGTTGTTGCG GCTGGATGAG ATCACGTCGG TGTCGATTCC GAGCGTGGCT 
CAGGAAGCGG CTCGTGACTT GGTGCGTGCC CGCGAGGACT GCCGCGGCGA CCTGATGCGG 
GCTCGGCATC GCCTGTCCAA GCTGCTGTTG CGCCACGGCA TCGTGTACTA CGGCGGGCAG 
GCCTGGACCG GTGCCCATGA TCAGTGGCTG CGCACCGTCG CCGCGCCGCA GCTCATGGCG 
CCGGCGACGC GGATGGCCTT TGACGCCGAC TATGACCACG TGTTGACAAT GCAGGCCCGG 
CGGCGACGGC TGGACGCAGC GATCGAGGAG AGGGCCGCCG ATAGTGAGTT CACCGCGATC 
GTGCGGCGGG TGTCGTGTCT GCGGGGGGTG AACACGTTGA CCGGGTTTGC GTTGGCAGTC 
GAAATCGGTG ATTGGAACCG GTTCACCGGC AACACGATTG GTTCCTTCGT CGGGCTGGTT 
CCCTCGGAGT TTTCGTCGGG CTCCTCGCGG GCTCAAGGTC CGATCACCAA GACCGGCAAC 
ACCCATGTCC GGCGGCTGCT GGTCGAGGCG GCGTGGCATC ACAAGCCGCG ATATCGGGTC 
GGTACGGTGA TGCGTTCGCG GTGGGATCGG GCATCTGCGG CGGCCCGCGC CCGCGGGGAC 
GAAGGCAACC GCCGCCTGCA TGGCAGGTGG GTGGGCTTCC TGGAGCGACG CAAACGACCC 
GTGACGGCCA ATGTCGCGGT CGCGCGTGAG CTGGCCGGCT GGTGCTGGTC GCTGGCCGTC 
ATGGACGACT GA

Protein sequence

MFTERTSVGL DVHARSVAAA AIDGVTGEVQ QTRLTPSHEH IRSWISGLAG PVAVAYEAGP 
TGFGLQRSLT EAGIRCVVVA PSKLQKPAGD RVKTDARDAL HLCRLLRLDE ITSVSIPSVA 
QEAARDLVRA REDCRGDLMR ARHRLSKLLL RHGIVYYGGQ AWTGAHDQWL RTVAAPQLMA 
PATRMAFDAD YDHVLTMQAR RRRLDAAIEE RAADSEFTAI VRRVSCLRGV NTLTGFALAV 
EIGDWNRFTG NTIGSFVGLV PSEFSSGSSR AQGPITKTGN THVRRLLVEA AWHHKPRYRV 
GTVMRSRWDR ASAAARARGD EGNRRLHGRW VGFLERRKRP VTANVAVARE LAGWCWSLAV 
MDD