Gene Mkms_5906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5906
Symbol
ID	4610614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008704
Strand	+
Start bp	105995
End bp	107419
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	66%
IMG OID	639789560
Product	integrase catalytic subunit
Protein accession	YP_935895
Protein GI	119855292
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	0.872405
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.876149
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCAAGC GTAAGGACGC GGAATCGGTT GGTAGGCGAC GGCAGTGGGC GGCTGACCGT 
GCGTTGCGGC CTGCGATGCG CTCACCAGGG CGCCCGGACC CGTCGCGGTC GGTGCAGCGT 
CAGTTTTGGC GGCTGATCGC CCAGGGTGTC TCCACCGACG ACGCAGCCGC AGAGGTCGGC 
GTGTCGACAC CGGTGGCGAC CAGGTGGTTC CACCACGCTG GCGGCATGAC GCCGATCAGT 
CTGGATGAGC CCACGGGCCG GTATCTGTCG TTCGCCGAGC GGGAGGAGAT CGCACTGCTA 
CGCGCCCAGG GCGCCGGGGT GCGTGAGATC GCCCGCGAGA TCAAGCGTGA CCCCTCGACA 
GTTTCGCGGG AACTGCGGCG CAACGCAGCC ACCCGCAGCG GCACGCAGGT GTACCGCGCA 
GGGGTGGCGC AGTGGAAGGC CCAGCAAGCA GCAAAGCGCC CGAAACCCGC GAAACTGGCA 
GTCAACCCGC AGCTGCGTGA GTACGTGCAG CAGCGGCTCG ATGGCAGTGT CCGCGGACCC 
GACGGCACCG CCGTCGCAGG TCCGCAGACC AAGGCCTGGA ACGGCCGCAA CAAGCCGCAC 
CGACAAGACC GACGGTGGTC GACAGCATGG AGCCCGGAAC AGATTGCCCA CCGCTTACCG 
CTGGATTTCC CCGATGATGA GTCCATGCGC ATCAGCCATG AGGCGATCTA TCAGTCCTTG 
TTCATCGAGG GGCGTGGGGC GCTCAAACGG GAATTGGTCG CGTGCCTGCG GACCGGTCGT 
GCGCTGCGGG TCCCGCGGGC CAGGACACAG AACAAACCGC AGGGACATGT CACCGCGGAC 
GTCGTGATCA GCAAACGCCC TGCCGAAGCC GCCGATCGCG CAGTTCCTGG GCATTGGGAG 
GGTGATTTGA TCATCGGTGC GGGCCGGTCG GCGATTGCCA CCGTGGTGGA ACGCAAGAGC 
CGCTCGGTGA TGCTGGTTCA CCTTCCCCGC CTCGAGGGGT GGGGTCTGGC GCCGCCGGTG 
AAGAACGGGC CGGCGCTCAG CGGCTACGGC GCCGAGGCGA TGAACGCTGC CCTGATCGCC 
TCACTGGCAC AGCTACCCAA GCAGCTGCGT CAGACGTTGA CATGGGACCG CGGCAAAGAG 
TTGGCCGCGC ACGCCCAGTT CACCTTCGAC ACCGGAACGA AGGTGTTTTT CGCCGACCCG 
CACTCGCCAT GGCAGCGGCC TACCAACGAG AACACCAATG GCGTTCTGCG TCAGTACTTT 
CCGAAAGGCA CCGACTTATC TCGATGGTCG GCTCAAGACC TCGAAGCGGT CGCACTGACG 
CTCAACAACC GACCCCGAAA GGTCCTCGGC TGGAAGACTC CCGCCGAAGT CTTTGCCCAA 
CAGCTACACT CACTCCAACA ACCCGGTGTT GCAACGACCG ATTGA

Protein sequence

MAKRKDAESV GRRRQWAADR ALRPAMRSPG RPDPSRSVQR QFWRLIAQGV STDDAAAEVG 
VSTPVATRWF HHAGGMTPIS LDEPTGRYLS FAEREEIALL RAQGAGVREI AREIKRDPST 
VSRELRRNAA TRSGTQVYRA GVAQWKAQQA AKRPKPAKLA VNPQLREYVQ QRLDGSVRGP 
DGTAVAGPQT KAWNGRNKPH RQDRRWSTAW SPEQIAHRLP LDFPDDESMR ISHEAIYQSL 
FIEGRGALKR ELVACLRTGR ALRVPRARTQ NKPQGHVTAD VVISKRPAEA ADRAVPGHWE 
GDLIIGAGRS AIATVVERKS RSVMLVHLPR LEGWGLAPPV KNGPALSGYG AEAMNAALIA 
SLAQLPKQLR QTLTWDRGKE LAAHAQFTFD TGTKVFFADP HSPWQRPTNE NTNGVLRQYF 
PKGTDLSRWS AQDLEAVALT LNNRPRKVLG WKTPAEVFAQ QLHSLQQPGV ATTD