Gene Gobs_4102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4102
Symbol
ID	8755793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	4313233
End bp	4314627
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	73%
IMG OID
Product	putative pep2 protein
Protein accession	YP_003411038
Protein GI	284992484
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.938013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCC TGACCGGACT GTTCCGGGAC TGGATGCCGT CCCAGCGCTG GTTCGGTGGC 
AAGGGCCGGG AGTGGGCCGG CGTCGAGGAG GAGAGCTTCT TCCTCGACCG CTCGCACCCC 
GTCCTGTCCA TCCACCGGGT GACGGTGACC TACACCGACG GCGCGACCGA GACCTACCTG 
GTGCCGCTGT CGTGGCGTGA CCACGCCGTG GAGGAGCTGG CCTTGGCGCA CATCGGCACC 
GTCGCGCACG AGAACGGCGA GAACCACGCC TACGACGCCA TGCGCGACCG CGAGGCCACC 
GCCAGCTGGC TCACCCACCT CGCCGACGGC GCCACGGTGG GCCCGATGCG GTTCGTGCCG 
GGCGAGGGTG CCGAGATCCC GGCCGGGCTC CCCGGCGACA TCGTCTCCAC CGAGCAGAGC 
AACACCTCGC TGGTGTATGG GCAGGAGGCC ATCCTCAAGC TGTTCCGGCG GCTCGAACCC 
GGCCTCAACC CGGACGTCGA GGTCCACAGC GCCCTGCGCC GGACCGACAA CCCGCACATC 
GCCCCGCTGC TCGGTCACGC CGAGATCGAC CACGACCGGG ACGCCGGCAC CCCGCCGGCG 
ACGGTCTTCA TGCTGCAGCG GTTCGTGCCC AACGCCAGCG ACGGGTGGCT GCTGGCCACC 
GCGAGCGTGC GCGACCTCTA CGCCGAGGGC GACCTGCACG CCGACGAGGT GGGCGGGGAC 
TTCGCCGCCG ACAGCGAGCG GCTCGGCGCG GCCACCGCCT CGGTGCACGC CGACATGGCG 
CAGGTGCTGC CGACCGAGGA GGCCGACCGC GACTGGTTCA CCACCGTCGC CCGGCAGATG 
ACCGAGCGGC TCGACGCCGC GATCGAGGTC GTCCCGCAGC TGGCCGAGCA CGCCGACGGG 
TTGCGTGCGG TGTACGCGGC CGTGGCGGAG AACCCCGAGC CCGTCGTCCG CCAGCGGGTG 
CACGGGGACC TGCACCTGGG CCAGGTGCTG CGCACCGCCA CCGGGTGGAT CGTGCTCGAC 
TTCGAGGGCG AGCCCGCCCG CCCGCTGGCC GCGCGCCGCG AGCTGGACAG CCCGATGCGC 
GACGTGGCCG GGATGCTGCG CAGCTTCGAC TACGCCGCCC GCCACATGCT CGTGGAGCAG 
CCGGGTGATC AACAGCGCGC GTACCGCGCG CAGGAGTGGG CAGAGCGCAA CCGGAGCGCG 
TTCTGCGCGG GCTACGCGGC CGCGAGCGGG ATGGACGCCT GCGGCAACAG CCCGTTGTTG 
CGCGCGTTCG AGGCGGACAA GGCCGTCTAC GAGTGCGTCT ACGAGGCGCG CAACCGCCCG 
CACTGGCTGA TGATCCCGCT GCAGTCGCTG TCCCGCCTCA CCGCCGCGGA CCAGCGCGGC 
GAGCCACGAC CCTGA

Protein sequence

MNALTGLFRD WMPSQRWFGG KGREWAGVEE ESFFLDRSHP VLSIHRVTVT YTDGATETYL 
VPLSWRDHAV EELALAHIGT VAHENGENHA YDAMRDREAT ASWLTHLADG ATVGPMRFVP 
GEGAEIPAGL PGDIVSTEQS NTSLVYGQEA ILKLFRRLEP GLNPDVEVHS ALRRTDNPHI 
APLLGHAEID HDRDAGTPPA TVFMLQRFVP NASDGWLLAT ASVRDLYAEG DLHADEVGGD 
FAADSERLGA ATASVHADMA QVLPTEEADR DWFTTVARQM TERLDAAIEV VPQLAEHADG 
LRAVYAAVAE NPEPVVRQRV HGDLHLGQVL RTATGWIVLD FEGEPARPLA ARRELDSPMR 
DVAGMLRSFD YAARHMLVEQ PGDQQRAYRA QEWAERNRSA FCAGYAAASG MDACGNSPLL 
RAFEADKAVY ECVYEARNRP HWLMIPLQSL SRLTAADQRG EPRP