Gene Mkms_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3988
Symbol
ID	4611928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4202248
End bp	4203843
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	72%
IMG OID	639793672
Product	hypothetical protein
Protein accession	YP_939970
Protein GI	119870018
COG category	[S] Function unknown
COG ID	[COG2966] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.911951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGTGG ATTCCGAACG ATCTGACGGA CCGCCCCGGC GTCGGCGCGC ACTGAATCTC 
GCGCTGCGGG GCCGACGCGA CCCGGCATCG GGTGCGGGCC AGCGCCGGCG GGTGTCGGGT 
GGGCTGAGCG AGCGGCACAC CCGCAAGGTC CTCGACCTGA CCGTCCGCCT CGCCGAGGTG 
ATGCTGTCCT CCGGGTCGGG TACCGCCGAC GTCGTCGCGA CGGCGCAGGA CGTCGCGCAG 
GCCTACCAGC TCACCGACTG TGTCGTCGAC GTCTTCGTCA CCACCATCTT CGTATCGGCG 
CTGCCGACCG CCGACAGCCC GCCGGTGACG ATCGTGCGGG CAGTCCACGC ACGCTCGACC 
GACTACTCGC GGCTCGCCGA ACTCGACCTG CTCGTCCGGC GGATCACCTC CGGCGGCGTA 
TCGGTCGACG AGGCCCACGA GGCGATGGAC GAGCTGACCG AGCGGCCCCA CCCGTATCCA 
CGCTGGGTCG CCACCGCGGG GTGGGCCGGT TTCGCCCTGG GCATCGCGAT GCTGCTCGGC 
GGAAGCTGGT TGACCTGGAT CCTGGCCGCG GTCTCCTCGG CGCTGATCGA TCGGGTCGGC 
CGGGTGCTCA ACCGGTGGGG CACGCCGTTC TTCTTCCAGC AGGCGGCGGG CGCGTTCATC 
GCGACGATGA TCGCCGTCGC GGCGTACCTC TACGCCGGGG TGGGGCCCAC CGCCCTGGTG 
GCGACCGGGA TCGTCATGCT GCTGGCGGGT CTGACCCTGG TGGGTTCGGT GCAGGACGCG 
CTGACCGGTT ACATGGTCAC CGCGGTGGCC CGCCTCGGTG ACGTCCTGTT CCTCACCGCG 
GGCATCGTCG TCGGCATCCT GGCCGGGCTG CAGGTCGCCG CGCTCGCCGG GATCCAGATC 
GAGCTCCACG TCGACGCCAC GGAGTCGTTC GTGATGCCGA CCCGGCCGGT GCCGATCCTG 
CTCGCGGTGC TGGGTGCCGC GCTTGCTGGC GCCTGCCTGA CGGTCGCCAG CTATGCGCGG 
CTGCGCTCGG TGCTCACCGC GGGTGTCGCC GCAGGGCTGG CGGAGGCGGT GCTGATCGGT 
CTGGGCGCAG CCGGGGTCGG CGGGGTGGTC GCCACCGGGA CCGCGGCCGT CGGCGTCGGT 
TTGCTGGCCA CCCTGATCTC GATTCGCCGG CAGGCTCCGG CCCTGGTCAC CGCCACCGCG 
GGCATCACTC CGATGCTGCC GGGCCTCGCG GTGTTCCGTG CGGTGTTCTT CTTCGCCGTC 
GACCGCAACA TCCCCGGTGG GATTGCCCAG GCGCTGGGTG CCGCCGCCAT CGCACTGGCC 
ATCGGGGCCG GTGTCGTGAT GGGCGAGTTG CTCGGCTCCC CGCTGCGCTA CCGCGCCGGG 
CGTATCGGCG ACTTCCTGCG CGTCGAAGGG CCGCCCGGGC TTCGCCGGGC GATCGGCAAT 
GTGGTTGCGC TGCGGCCGTC CGCCGGCCAG CAGCAGGCAC GTACCCCGCA CCGGCGGTCA 
TGGAGCGTGG CCCTCGAACC GAAGGTCAAG AATTCGGCGG CCGACGACGA CGAGGCGTCC 
GCAGGCCCCT CGGATGGTGA AAACGCGGAG CGGTAA

Protein sequence

MAVDSERSDG PPRRRRALNL ALRGRRDPAS GAGQRRRVSG GLSERHTRKV LDLTVRLAEV 
MLSSGSGTAD VVATAQDVAQ AYQLTDCVVD VFVTTIFVSA LPTADSPPVT IVRAVHARST 
DYSRLAELDL LVRRITSGGV SVDEAHEAMD ELTERPHPYP RWVATAGWAG FALGIAMLLG 
GSWLTWILAA VSSALIDRVG RVLNRWGTPF FFQQAAGAFI ATMIAVAAYL YAGVGPTALV 
ATGIVMLLAG LTLVGSVQDA LTGYMVTAVA RLGDVLFLTA GIVVGILAGL QVAALAGIQI 
ELHVDATESF VMPTRPVPIL LAVLGAALAG ACLTVASYAR LRSVLTAGVA AGLAEAVLIG 
LGAAGVGGVV ATGTAAVGVG LLATLISIRR QAPALVTATA GITPMLPGLA VFRAVFFFAV 
DRNIPGGIAQ ALGAAAIALA IGAGVVMGEL LGSPLRYRAG RIGDFLRVEG PPGLRRAIGN 
VVALRPSAGQ QQARTPHRRS WSVALEPKVK NSAADDDEAS AGPSDGENAE R