Gene Daro_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2009
Symbol
ID	3566956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2165074
End bp	2166036
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	54%
IMG OID	637680480
Product	peptidase S49
Protein accession	YP_285224
Protein GI	71907637
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	80
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAACC CCCAATCCCC CAATAACGAT TCCGCCTGGG AGCGCAAAAC CCTGGAGAAG 
CTGGTCTTCG CCGCACTTGA TGAGCAGCGA TCACGGCGGC GCTGGGGTAT TGCCTTCAAG 
GCGCTTGGTT TTGTTTATCT CCTGGTTGTA CTAATTGCAG TCGTTGACTG GGGGGCTGGC 
GCTGAGCATC AGGAGCGCCA CACTGCCATG GTCAATCTGA CAGGGGTTAT CGAGGCCAAG 
GGAGAGGCCA ATGCCGAGAA TCTGGTGGCC GCTTTAAACA GCGCCTTTGA TGAAAAAAAT 
GCGGTGGGCA TCATCTTGCG TATCAACAGC CCCGGAGGCA GTCCGGTTCA GGCTGGCATT 
ATCAACGACG AGATTCGACG TCTCCGCGGA AAATACCCCG CCAAGCCGCT CTATGCCGTG 
GTCGAGGATA TGTGTGCCTC TGGTGGTTAT TACGTTGCTG CAGCCGCGGA TAATATTTAC 
GTTAATAAGG CGAGTATTGT TGGCTCCATC GGCGTGTTGA TGGATGGCTT CGGTTTTACG 
GGCACCATGG ATAAAGCTGG TGTTGAGCGG CGCCTATTAA CTGCTGGGGA AAACAAGGGG 
TTTCTTGATC CGTTTTCCCC GCAGGCGCCA CAACATAAGG CCCATGCCCA ACTGTTGCTC 
AATGATATTC ACAAGCAATT CATTGATGTG GTGAAAGCTG GCCGTGGCAA GCGCCTAAAG 
GAAACCCCGG AAATGTTCTC GGGCTTGATG TGGACGGGGG CTCAGAGTAT TCAGCTTGGC 
CTCGCCGACG ACTTCGGTAG CGTCGACTCA GTGGCGCGTG ACATCATCAA GGCAGAAAAA 
GTCCTTGATT ACTCGGTCAA GGACAATATT GCCGAACGCT TTGCCAAGCG CCTTGGGGCA 
AGCACCTTCG CTGGTTTTTG GAAGGGTTTC TCGGAAAGCG CTCTTGGCGT GCGTTTGTAC 
TGA

Protein sequence

MDNPQSPNND SAWERKTLEK LVFAALDEQR SRRRWGIAFK ALGFVYLLVV LIAVVDWGAG 
AEHQERHTAM VNLTGVIEAK GEANAENLVA ALNSAFDEKN AVGIILRINS PGGSPVQAGI 
INDEIRRLRG KYPAKPLYAV VEDMCASGGY YVAAAADNIY VNKASIVGSI GVLMDGFGFT 
GTMDKAGVER RLLTAGENKG FLDPFSPQAP QHKAHAQLLL NDIHKQFIDV VKAGRGKRLK 
ETPEMFSGLM WTGAQSIQLG LADDFGSVDS VARDIIKAEK VLDYSVKDNI AERFAKRLGA 
STFAGFWKGF SESALGVRLY