Gene Gobs_3974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_3974
Symbol
ID	8755662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	4172804
End bp	4174168
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	72%
IMG OID
Product	peptidase M50
Protein accession	YP_003410912
Protein GI	284992358
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.17805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGCTGA CCGTCCTCGG GATCGTCGCC TTCGCGGCCG GTCTGCTGTT CTCGATCGCC 
TTCCACGAGT ACGGGCACTT CTTCTGGGCC CGGAAGTTCG GCATGCGGGT GCCGCAGTTC 
ATGGTCGGTT TCGGCCCGAC GCTGTTCTCC CGCACGCGGG GGGAGACCGA GTACGGGATC 
AAGGCCGTCC CGCTGGGCGG CTACATCCGC ATCGTCGGGA TGATCCCGCC GGCCGAGGAG 
AACGAGAGCA CGCGGGCCAC CCGCATGCGC TCGTTCATCG CCGAGGTGCG CGGCGCCGCG 
CTCGACGACG TCCGCCCCGG CGACGAGGGC CGGGTGTTCT ACGCCAAGCC CTGGTGGCAG 
CGGGTCATCG TGATGTTCGC CGGCCCCTTC CACAACCTGG TGCTCGCGGT CCTGCTCTTC 
ACGGTGCTGC TCACCGTCGT CGGCACCAGC GTGCTGACCA CGACGGTGCG CGACGTCCCC 
GCGTGCGTGC TGCCCGCGGG TGCCGTCACC GCGCTGCAGG ACGACGCCTG CTCGGTGCCG 
CTCACGCCCG AGGGGCAGAC CTGCGAGGCG GGGGCGGCAG GCTGCGCGCT GCCGCAGCAG 
AGCCCCGCCG CGGCCGCCGG GCTGCGTTCC GGCGACACGA TCGTCGCCAT CGGGGGCCGG 
CCGCTGGACC CGACCGCGTA CGACAGCTGG ACGGCGGTGC AGGAGGCGAT CCGCACCAGC 
CCCGGTCAGC CGCTGGACGT CACCATCGAG CGGGACGGCG CGCGGCAGCG GCTCACCGTC 
ACGCCGATCC CCAACACCGT CTACGCCGAC CCGACCGACC CCACCGAGGG GACGACGACC 
GCCGGCTACC TCGGGATCTC GCCGAGCGTC CAGCTGGCCC GGCAGGACGC CGCGGCCATC 
CCCGGCTACT TCGGGATGAT CGTGACGAAC GCCGTCGAGC GGCTGGTCGA GATCCCCGAG 
CGCATCCCGC AGCTGTTCCG CGCGGCGTTC CTGGGTGAGG AGCGCGACCC CAACGGGCCG 
ATCGGCGTCG TGGGCGTCGG CCGCATCTCC GGCGAGGTCT TCGCCATCCC CGAGCTCACC 
GGCACGGAGA AGGTCAGCAC GTTCCTGCAG CTGCTGGCCA GCATCAACCT GGTGCTGTTC 
CTGTTCAACC TGCTGCCGAT CTACCCGCTC GACGGCGGGC ACGTCGCCGG CGCGCTGTAC 
GAGAAGGCGC GCGCGGTCGT CGCCCGGCTG CGTGGCCGGC CCGACCCCGG CCCGTTCGAC 
ATCGCCCGGC TGATGCCGGT CGCCTACCTC GTGGCGGGCC TGTTCGTCGT CCTCTCGGGC 
CTGCTGCTGA TCGCCGACAT CGTCAACCCG ATCACCCTGC AGTGA

Protein sequence

MLLTVLGIVA FAAGLLFSIA FHEYGHFFWA RKFGMRVPQF MVGFGPTLFS RTRGETEYGI 
KAVPLGGYIR IVGMIPPAEE NESTRATRMR SFIAEVRGAA LDDVRPGDEG RVFYAKPWWQ 
RVIVMFAGPF HNLVLAVLLF TVLLTVVGTS VLTTTVRDVP ACVLPAGAVT ALQDDACSVP 
LTPEGQTCEA GAAGCALPQQ SPAAAAGLRS GDTIVAIGGR PLDPTAYDSW TAVQEAIRTS 
PGQPLDVTIE RDGARQRLTV TPIPNTVYAD PTDPTEGTTT AGYLGISPSV QLARQDAAAI 
PGYFGMIVTN AVERLVEIPE RIPQLFRAAF LGEERDPNGP IGVVGVGRIS GEVFAIPELT 
GTEKVSTFLQ LLASINLVLF LFNLLPIYPL DGGHVAGALY EKARAVVARL RGRPDPGPFD 
IARLMPVAYL VAGLFVVLSG LLLIADIVNP ITLQ