Gene Gobs_4224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4224
Symbol
ID	8755918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	4436964
End bp	4438331
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	76%
IMG OID
Product	hypothetical protein
Protein accession	YP_003411157
Protein GI	284992603
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATG TCCCGTTCGG CTTCGGTGTC CCCGACCGCG ACCCCGAGCG TCGCGACCAG 
TCCGGGTCAG GCCCCGGGAA CGACCCCTTC GGATTCGGCG CTCTCTTCGG TGGCGCCGGT 
GGGGGGACGC CGGACGAGCT GCTCGCCAAG ATGCCGCTGT TCGCCGAGCT GCAGAAGCTG 
ATGACCTGGT CCGGCGGCCC GGTCAACTGG GACCTGGCGC GGCAGGGGGC GATCAGCTCG 
CTGGCCGCCG GTTCGCAGCC GTCCTCCGAC GCCGAGCGCG CCGCCGTCGC CGATGCTCTG 
CGCCTGGCCG ACCTGTGGCT CGACCAGGTC ACCGAGCTGC CCTCCGGCGT GGACCGGCCG 
CTCGCCTGGT CCCGCGTGGA GTGGGTGGAG CAGACGCTGC CCGCCTGGAG CACCCTCATC 
GACCCGCTCG CCGAGCGCGT CGTCGGCGCC ATGACCAGCG CCCTCCCCGC CGAGGCGGCC 
GCGATGGCCG GCCCGCTCGC CGGGATCATG GGCCGGATGG GCGGCCTGAT GTTCGGCGCC 
CAGGTCGGCC AGGCGCTCGG CCGGCTGTCC GGCGAGGTCC TCACCAGCGG CGAGATCGGC 
ATCCCGCTGG CCCCGGCCGG CGCCGGCGTC CTGCTGCCGC AGAACGTCGC CGAGTTCGCG 
GCCGGCCTCG ACCGCCCCGC CGACGAGGTG CGACTGTTCC TCGCGTTGCG CGAGGCGGCC 
TCGCAGCGGC TGTTCGTGCA CGTGCCGTGG CTGCGCCAGC AGCTGCACGA CGCCGTCCAC 
GCGTACGCGC GCGGCATCCA CGTCGACCGC GAGGCGATCG AGCGCGGCAT CAACGAGGCG 
ATGGGTTCGA TGGGCGGGAT CGACCCGACC AACCCCGAGG GCATCCAGGC GCTGCTGGGC 
AGCGGGCTGC TGGAGCCCGA GGAGACCCCC GAGCAGCAGG CGGCGCTGCG CCGGCTGGAG 
ACGCTGCTCG CGCTCGTCGA GGGCTGGGTC GACAGCGTGG TGGCCGCGGC CGCCGGCGAC 
CGGCTGCCCG GGCACGGAGC GCTGGCCGAG ACGATGCGCC GCCGTCGCGC CTCCGGCGGG 
CCGGCCGAGC AGACCTTCGC GACCCTGGTG GGCCTGGAGC TGCGGCCGCG GCGGCTGCGC 
GACGCCGCCA CCGTGTGGGG CGCGATGGCC CAGCAGCACG GCAACGCCGA GCGCGACCGG 
CTGTGGTCGC ACCCGGACCT GCTGCCGACG TCGGACGACC TGGACGAGCC GCTCGACTTC 
GTCGCCCGCC AGGGTGCGGA CGACGAGCTG CGCAGCCTCA CCGCCGACGA CGCCCAGGAG 
CCCGGCACCC AGAAGCCCGA CACCGACGGC CGCGACAGCG GGGACTGA

Protein sequence

MSDVPFGFGV PDRDPERRDQ SGSGPGNDPF GFGALFGGAG GGTPDELLAK MPLFAELQKL 
MTWSGGPVNW DLARQGAISS LAAGSQPSSD AERAAVADAL RLADLWLDQV TELPSGVDRP 
LAWSRVEWVE QTLPAWSTLI DPLAERVVGA MTSALPAEAA AMAGPLAGIM GRMGGLMFGA 
QVGQALGRLS GEVLTSGEIG IPLAPAGAGV LLPQNVAEFA AGLDRPADEV RLFLALREAA 
SQRLFVHVPW LRQQLHDAVH AYARGIHVDR EAIERGINEA MGSMGGIDPT NPEGIQALLG 
SGLLEPEETP EQQAALRRLE TLLALVEGWV DSVVAAAAGD RLPGHGALAE TMRRRRASGG 
PAEQTFATLV GLELRPRRLR DAATVWGAMA QQHGNAERDR LWSHPDLLPT SDDLDEPLDF 
VARQGADDEL RSLTADDAQE PGTQKPDTDG RDSGD