Gene Mmcs_4666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4666
Symbol
ID	4113495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	4945024
End bp	4946448
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	66%
IMG OID	638033817
Product	integrase catalytic subunit
Protein accession	YP_641826
Protein GI	108801629
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCAAGC GTAAGGACGC GGAATCGGTT GGTAGGCGAC GGCAGTGGGC GGCTGACCGT 
GCGTTGCGGC CTGCGATGCG CTCACCAGGG CGCCCGGACC CGTCGCGGTC GGTGCAGCGT 
CAGTTTTGGC GGCTGATCGC CCAGGGTGTC TCCACCGACG ACGCAGCCGC AGAGGTCGGC 
GTGTCGACAC CGGTGGCGAC CAGGTGGTTC CACCACGCTG GCGGCATGAC GCCGATCAGT 
CTGGATGAGC CCACGGGCCG GTATCTGTCG TTCGCCGAGC GGGAGGAGAT CGCACTGCTA 
CGCGCCCAGG GCGCCGGGGT GCGTGAGATC GCCCGCGAGA TCAAGCGTGA CCCCTCGACA 
GTTTCGCGGG AACTGCGGCG CAACGCAGCC ACCCGCAGCG GCACGCAGGT GTACCGCGCA 
GGGGTGGCGC AGTGGAAGGC CCAGCAAGCA GCAAAGCGCC CGAAACCCGC GAAACTGGCA 
GTCAACCCGC AGCTGCGTGA GTACGTGCAG CAGCGGCTCG ATGGCAGTGT CCGCGGACCC 
GACGGCACCG CCGTCGCAGG TCCGCAGACC AAGGCCTGGA ACGGCCGCAA CAAGCCGCAC 
CGACAAGACC GACGGTGGTC GACAGCATGG AGCCCGGAAC AGATTGCCCA CCGCTTACCG 
CTGGATTTCC CCGATGATGA GTCCATGCGC ATCAGCCATG AGGCGATCTA TCAGTCCTTG 
TTCATCGAGG GGCGTGGGGC GCTCAAACGG GAATTGGTCG CGTGCCTGCG GACCGGTCGT 
GCGCTGCGGG TCCCGCGGGC CAGGACACAG AACAAACCGC AGGGACATGT CACCGCGGAC 
GTCGTGATCA GCAAACGCCC TGCCGAAGCC GCCGATCGCG CAGTTCCTGG GCATTGGGAG 
GGTGATTTGA TCATCGGTGC GGGCCGGTCG GCGATTGCCA CCGTGGTGGA ACGCAAGAGC 
CGCTCGGTGA TGCTGGTTCA CCTTCCCCGC CTCGAGGGGT GGGGTCTGGC GCCGCCGGTG 
AAGAACGGGC CGGCGCTCAG CGGCTACGGC GCCGAGGCGA TGAACGCTGC CCTGATCGCC 
TCACTGGCAC AGCTACCCAA GCAGCTGCGT CAGACGTTGA CATGGGACCG CGGCAAAGAG 
TTGGCCGCGC ACGCCCAGTT CACCTTCGAC ACCGGAACGA AGGTGTTTTT CGCCGACCCG 
CACTCGCCAT GGCAGCGGCC TACCAACGAG AACACCAATG GCGTTCTGCG TCAGTACTTT 
CCGAAAGGCA CCGACTTATC TCGATGGTCG GCTCAAGACC TCGAAGCGGT CGCACTGACG 
CTCAACAACC GACCCCGAAA GGTCCTCGGC TGGAAGACTC CCGCCGAAGT CTTTGCCCAA 
CAGCTACACT CACTCCAACA ACCCGGTGTT GCAACGACCG ATTGA

Protein sequence

MAKRKDAESV GRRRQWAADR ALRPAMRSPG RPDPSRSVQR QFWRLIAQGV STDDAAAEVG 
VSTPVATRWF HHAGGMTPIS LDEPTGRYLS FAEREEIALL RAQGAGVREI AREIKRDPST 
VSRELRRNAA TRSGTQVYRA GVAQWKAQQA AKRPKPAKLA VNPQLREYVQ QRLDGSVRGP 
DGTAVAGPQT KAWNGRNKPH RQDRRWSTAW SPEQIAHRLP LDFPDDESMR ISHEAIYQSL 
FIEGRGALKR ELVACLRTGR ALRVPRARTQ NKPQGHVTAD VVISKRPAEA ADRAVPGHWE 
GDLIIGAGRS AIATVVERKS RSVMLVHLPR LEGWGLAPPV KNGPALSGYG AEAMNAALIA 
SLAQLPKQLR QTLTWDRGKE LAAHAQFTFD TGTKVFFADP HSPWQRPTNE NTNGVLRQYF 
PKGTDLSRWS AQDLEAVALT LNNRPRKVLG WKTPAEVFAQ QLHSLQQPGV ATTD