Gene Dole_1739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1739
Symbol
ID	5694578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2089047
End bp	2090006
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	61%
IMG OID	641264336
Product	signal peptide peptidase SppA, 36K type
Protein accession	YP_001529620
Protein GI	158521750
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000870898
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGTTGC CGGGATGCAG CCTGCCCGGC CTCAAACTGC CGGCCGATGC CACTGACCCG 
CTGCGGGAGT TCGTACTGGA GGGCTCAGGC CCCCAGAAAA TCGCCATGGT TTCAGTCAAC 
GGCGCCATTA CAGATAAGCC CACCAGGGAT TTCATGTCCC GCAACCATCC GGGCATGCTG 
GACGAATTCG TGGCCCAGCT GGCACTGGCA AAAGAGGACC CATCCATCAA AGCCCTGGTG 
CTGAAGGTCA ATTCGCCGGG CGGCACCATC ACGGCCAGCG ACATCATGTA CAAGGAGTTG 
ATGGATTTCA AACAGCAGAC CGGCAAACCC GTTGTGGCGG CCCTGATGGA TGTGGCAGCC 
TCCGGCGGTT ATTACATCTC CCTGCCGGCG GACCACATCC TGGCCCATCC CACCACGCTT 
ACCGGGTCAG TGGGCGTGAT TTTTGTCACG CCACGGGTCA GCGGTTTGAT GGACAAGCTG 
GGGCTGGACA TGAAAATCCG CAAATCGGGC AAGCACAAGG ACATGGGCTC CCCTTTCCGG 
GATACCACGG CGGAGGAGGA CGCTCTGTTT GACGGTATCA TCGACGACAT GGCCGGGCGG 
TTTGCCGGGC TGGTGGAGAA GCACCGGGCC GATCAGAAGC CAGACATGGA AAAAATCAAA 
ACAGCCCGCA TCTTTACGGC TGACGACGCC CTTTCCGCCG GCCTGGTTGA CCAGGTCGGC 
TATCTTGAAG ACGCCCTGGC CCAGGCAAAA AAGATGGCCG GGCTGCCGGA CAACGCGGCC 
GTGGTGACCT ATCGCCGGAC CTACTATCCC AACGACACCA TCTACAATAC CCTGGTGACA 
CAATACGGGG CCCATTCCGG GGCACTGGTC AACATTGATC TGCTGGAGAG CATGCCCGCG 
CTTAAGCCGG GCCTGTACTA CCTGTGGTGG CCCGGCGCCG GGAACAGCGT GCAGCCCTGA

Protein sequence

MVLPGCSLPG LKLPADATDP LREFVLEGSG PQKIAMVSVN GAITDKPTRD FMSRNHPGML 
DEFVAQLALA KEDPSIKALV LKVNSPGGTI TASDIMYKEL MDFKQQTGKP VVAALMDVAA 
SGGYYISLPA DHILAHPTTL TGSVGVIFVT PRVSGLMDKL GLDMKIRKSG KHKDMGSPFR 
DTTAEEDALF DGIIDDMAGR FAGLVEKHRA DQKPDMEKIK TARIFTADDA LSAGLVDQVG 
YLEDALAQAK KMAGLPDNAA VVTYRRTYYP NDTIYNTLVT QYGAHSGALV NIDLLESMPA 
LKPGLYYLWW PGAGNSVQP