Gene Gobs_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_1451
Symbol
ID	8753116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	1499643
End bp	1500758
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	72%
IMG OID
Product	integrase family protein
Protein accession	YP_003408552
Protein GI	284989998
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCAGAC CCCATCTGGA GCTCGGCACC CACGGCCGGG TCCGCGTCTA CCCGGATCCG 
GCCGGGTACC GGGCGGTGTG TCTGTACCGG GACTGGGACG GGGCCACCCG GCAGGTGCAA 
CGGCAGGCCA AGACCAAGGG GGCGGCGGAG CGGGCCCTCG CTGTGGCGCT GCGAGATCGG 
GGACGTCCGG GAACGGGCCA CGAGATCACT CCGGACACCA AGGTCGCCGA CCTCGCGGCG 
AAGTGGTTCA GCGAGCTCGA GGGCAAGAGC CCGTCGACGA TGCAGGCCTA CCGTGACCGG 
CTCGATCGGC AGGTCCTCCC GGCACTGGGC AGCGTGCGGG TGCGTGAGCT CAGCGTCGGG 
TTGCTCGATC GTCACCTGGC GGCCGTGCGG GCGTCGCACG GCCCGGCGCT GGCGAAGATG 
ACCAAATCGG TGATCAGCGG CATGTGCGGC CTGGCCTGCC GCCACGACGC CCTGAAGGCC 
AACCCCTGCC GGGACGTGGC GCGCATCCCC AGCCAGACCC GGCGGGCGCC GCGGGCGCTG 
ACCGCGGACG AGGTCAGGTC GGTGCGGGCA TGGCTGAGCG AGGACGCGAC GGCTCGCGAG 
CGGGATATGC CGGACCTCGT GGCGTTCATG GTCGCCACCG GTCTCCGCAT CGGCGAGGCC 
TGTGCAGTCA GCTGGCCGGA CGTGGACCTC GATGCCGACA CCGTCACGGT CACGGGGACG 
GTGCTGCGGG TCAAGGGTCA GGGCCTGGTC GTCAGCCAGC CGAAGTCGAT GGCGGGGGAG 
CGGGTGCTGG AGCTGCCGAG CTGGTGTGTC GCGCTCCTGC GGCGGCGCGG GCCGTCGAGC 
GGACCGGTCT TCCCCGCGCC GCGCAGCCGC AAGCTGCGCG ACCCGAACAA CACCCGCCGG 
GCCCTTCGCG AGGCGTTCCA TGCAATGGGG ATGCCGGGCG TCACCTCCCA CGCCTTCCGC 
AAGACCGTCG CCACGCTCAT GGACGAGGCG GGGTTGTCCG CCAGGAGCGC GGCCGACCAG 
CTGGGGCACG CCAAGCCGTC CGTCACGCAG GACGTCTACT ACGGCCGCAG GAGGCGGGCC 
ACCGGAGCGG CTCAGGTCCT CGAGCAACTG GCTTGA

Protein sequence

MARPHLELGT HGRVRVYPDP AGYRAVCLYR DWDGATRQVQ RQAKTKGAAE RALAVALRDR 
GRPGTGHEIT PDTKVADLAA KWFSELEGKS PSTMQAYRDR LDRQVLPALG SVRVRELSVG 
LLDRHLAAVR ASHGPALAKM TKSVISGMCG LACRHDALKA NPCRDVARIP SQTRRAPRAL 
TADEVRSVRA WLSEDATARE RDMPDLVAFM VATGLRIGEA CAVSWPDVDL DADTVTVTGT 
VLRVKGQGLV VSQPKSMAGE RVLELPSWCV ALLRRRGPSS GPVFPAPRSR KLRDPNNTRR 
ALREAFHAMG MPGVTSHAFR KTVATLMDEA GLSARSAADQ LGHAKPSVTQ DVYYGRRRRA 
TGAAQVLEQL A