Gene Daro_0895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0895
Symbol
ID	3569997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	968024
End bp	969088
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	63%
IMG OID	637679353
Product	TPR repeat-containing protein
Protein accession	YP_284121
Protein GI	71906534
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	0.643748
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTGA TCAACGACAT GCTGCGCAAT CTCGAGACCA AGCGTCCCGA TGACCTGGCC 
CGGCAGAACC TGCAGCGGGA AATACGTTCC TTGCCGGCTG CTAGCAGTGA TCATGGTCAT 
ACGGCCAAAT TGATTTTGGT CGGTGGCTTG TTGCTGCTGA TTGGCGCTGG TGTCCTCCAT 
GCGAATGGCC GTCTGCTGCC TCTGTTGGGG CTTGATCATG CGCCGGTTGT GGCGCCTGTT 
CCACCTGCCG TAGTTGCTCC TGCGCTATCA CCAGCGCCCG TTGTGGTCGC AGAACCGGTG 
GACGACAAAT TGCGCCTGGC CTCGAATCTT GAGGTCTTGC CGCTTCCCGC CGCGCCGGTC 
CTGCCGGTGC CTGATCCAGT CGTGCCGATA GCTGCAAGCG CGCCGAAAAG CGAACCCGCT 
TCGGCGATTC CGGAAGTGCC GAAGCCGGCA TCTCTCGCAC CGGTCGGGCC AGTCAAGATC 
GAGAAAAGCC CGATCGCGGC GACCCCGCGT GATCGGGCCG ATGCCGAGTA CCGCAAGGCA 
GAAGGTGCGA TGGCTTCAGG CCGTAGCGCC GAGGCCATCG AAGGCATGCG GGCAGCGTTG 
AAACAGGATC CCGGCTATGT CCCGGTCCGT CAGGCACTGC TCCGTCTGTT GCTCGACATG 
CGCAAGAACG ATGAGGCGAT GCTCGTGCTG CAGGAAGGGC TTGAGCTTCA GCCGGCCCAG 
ACCGGCTGGG CGATGTCACT GGCCCGCCTG CAACTGGAGC ACGGCGATCT GGCCGCAGCG 
GACCGCACGC TGGCTCGTTC GCAGGCTTAT GCCGAAGCCA ATGCCGACTA TGCCGGTTTT 
CAGGGGCACC TGAAGTCGCG TCTCGGTGCC CAGCGTCTGG CCGTTGGCCA TTATCAGCGG 
GCAGCGCGTC TGGCGCCGAA CGAAGGCCGC TGGTGGCTGG GGCTCGGATT GGCTCTTGAA 
GCGGATGGTC ACCTTCCCGA GGCGAAGGAT GCGTTCCGAC GCGGCATGGC TTCCGGGACT 
CTGTCGGCTG ATCTAAGCGC GATTGCCGAA CAGCATTTGC GTTAA

Protein sequence

MSLINDMLRN LETKRPDDLA RQNLQREIRS LPAASSDHGH TAKLILVGGL LLLIGAGVLH 
ANGRLLPLLG LDHAPVVAPV PPAVVAPALS PAPVVVAEPV DDKLRLASNL EVLPLPAAPV 
LPVPDPVVPI AASAPKSEPA SAIPEVPKPA SLAPVGPVKI EKSPIAATPR DRADAEYRKA 
EGAMASGRSA EAIEGMRAAL KQDPGYVPVR QALLRLLLDM RKNDEAMLVL QEGLELQPAQ 
TGWAMSLARL QLEHGDLAAA DRTLARSQAY AEANADYAGF QGHLKSRLGA QRLAVGHYQR 
AARLAPNEGR WWLGLGLALE ADGHLPEAKD AFRRGMASGT LSADLSAIAE QHLR