Gene Gobs_4410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4410
Symbol
ID	8756104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	4644226
End bp	4645560
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	72%
IMG OID
Product	protein of unknown function DUF21
Protein accession	YP_003411336
Protein GI	284992782
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.938013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACG TCTGGCTCAA CATCCTGATG GTCGTCGTCT TCGTCCTGAT AGGCGGCGTC 
TTCTCGGGGG CGGAGATCGC CCTGGTGTCC CTGCGCGAGT CGCAGGTGCG CGCGCTGGCC 
GAGTCGGGGG GACGCCGCGG CCAGGCGGTG CAGCGGCTGC TCAGCGACCC CAACCGCTTC 
CTCGCCGCCG TCCAGGTCGG CGTCACCCTG GCCGGCTTCT TCTCCGCCGC GTTCGGTGCC 
AGCACGCTGT CCCAGCCGCT CGGCGAGTGG TTCATCACCC TCGGCATGCG CGCCGGGCTG 
GCCGACCCGC TGGCCTTCGT GCTGGTCACC ATCGCGATCA GCTACCTGTC CCTGGTGGTC 
GGCGAGCTGA CCCCCAAGCG CCTGGCGCTG CAGCGTGCCG AGGGCTTCTC CCTGCTCGTC 
GCCGCGCCGC TCAACGCGAT CGCCAAGCTG TCGCGCCCGG TCATCTGGCT GTTGTCGAAG 
TCGACCAACC TGCTCGTCCG GCTGGTGGGC GGGGACCCGA CCGCCAGCGG TGAGTCGATC 
AGCCAGGAGG AGCTGCGCGA CCTGGTCACG GCGCACGAGT CGCTGAGTTC CGACGAGCGC 
CGGCTCATCG GCGAGGTCTT CAGGGCCGGC GACCGCGAGG TGCGCGAGGT CATGACCCCG 
CGCACCGAGG TGGACTTCCT CGACGCGTCG ATGACCGCCA GCCGGGCCGC CAAGCAGGTG 
CACGACTCCA GCCACTCCCG CTACCCGGTC GTCGGCCGCG ACGAGGACGA CGTCCTGGGC 
TTCGTGCACG TCCGCGACCT GTTCCTGCCC AACCACCCGG CCGGGCGCGC GGCGACCGTC 
GGCGACCTGG TCCGCGAGGT CAAGCGGCTG CCGGGCACCG CCGGCGTCCT CACCGCGCTG 
TCGGAGATGC GGCGGGAGAA CCAGCACCTG GCGATCGTCG TCGACGAGTA CGGCGGCACC 
GACGGGATCG TCACCCTCGA GGACCTCATC GAGGAGGTCA TCGGGGAGAT CTACGACGAG 
TACGACGAGG GCGTCGCCGA CGGCGGGGAC GAGCGGCCGG ACGGCCCGCA GGAGCTCGAC 
GGGCTGCTCA ACCTCGACGA CTTCCGCGAG GCGACCGGCC TGCAGCTGCC CGAGGGGCCC 
TACGAGACCG TCGCCGGCTA CGTGCTCGCC GAGCTCGGCC GGCTGCCCGT CGTCGGCGAC 
AGCGTCGAGG TCGAGGGGCG CACGCTCACC GTCCTGGAGC TCGACGGACG GCGGATCGCG 
CGGATCTCGG TCAGCCGCGC CCCGCAGCCC GAGGTCGACC CGTCCCAGGT GCCGACCACC 
ACGATCGGCA CCTGA

Protein sequence

MSDVWLNILM VVVFVLIGGV FSGAEIALVS LRESQVRALA ESGGRRGQAV QRLLSDPNRF 
LAAVQVGVTL AGFFSAAFGA STLSQPLGEW FITLGMRAGL ADPLAFVLVT IAISYLSLVV 
GELTPKRLAL QRAEGFSLLV AAPLNAIAKL SRPVIWLLSK STNLLVRLVG GDPTASGESI 
SQEELRDLVT AHESLSSDER RLIGEVFRAG DREVREVMTP RTEVDFLDAS MTASRAAKQV 
HDSSHSRYPV VGRDEDDVLG FVHVRDLFLP NHPAGRAATV GDLVREVKRL PGTAGVLTAL 
SEMRRENQHL AIVVDEYGGT DGIVTLEDLI EEVIGEIYDE YDEGVADGGD ERPDGPQELD 
GLLNLDDFRE ATGLQLPEGP YETVAGYVLA ELGRLPVVGD SVEVEGRTLT VLELDGRRIA 
RISVSRAPQP EVDPSQVPTT TIGT