Gene Daro_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0019
Symbol
ID	3570043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	24827
End bp	25903
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	61%
IMG OID	637678448
Product	SMF protein
Protein accession	YP_283248
Protein GI	71905661
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.108355
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCATA ACGACAGTCT GGCCGCCTGG TTGCGGCTGA CCCTGATCCC GGGCATCGGC 
GGCGAGACGC AAAGAAAGCT TCTCGCCGCT TTCGGTTTAC CGGAAGCCAT TTTCTCGGCT 
GGCCGCCTGG AAGCACGCGG CGTCATCGGT AACCGCGCCG ATCTGCTGTT CGATTTTGAT 
CCGACGGAAG CGGTAGCACA CAGTCTCGAA TGGGCCAGGC AACCGGGGCA ACACATCATC 
TCGCTGGCCG ACGAAGCCTA CCCGAAAGCA CTGCTCGAAA TAGCCGACCC GCCCAGCCTG 
CTCTACGTAC GCGGCAACCT AGCCCTGCTC CAGAAGCGCG GACTGGCCAT GGTTGGTAGC 
CGCAATGCAA CACCGCAAGG CGTGCAAACC GCCGAAAACT TCGCCAAAAC GCTGGCCGCC 
AAGGGTCTGA CAATCATTAG CGGACTGGCA CTGGGGATTG ATGCCGCCGC CCACCGTGGC 
GCCCTGGCTG CCAAGGGGGA AACCATCGCG GTGATCGGCA CCGGGCCCGA CCGCATCTAC 
CCGGCACGCA ACAAGGAGCT GGCTTTGGCG ATTGTCGAAT CCGGTGCGAT CGTTTCCGAA 
TTCCCGCTCG GCACACCGGC CATCGCTTCA AATTTCCCAA GGCGCAATCG GATCATTTCC 
GGACTATCGT GCGGCGTACT GGTGGTCGAA GCGGCGCCGG AAAGTGGCTC GCTGATCACG 
GCGCGGCTTG CCGCAGAGCA GGGGCGTGAA GTTTTCGCCA TTCCCGGCTC GATCCACTCA 
CCAGTTGCTC GTGGTTGCCA CAAATTGATC AAGCAGGGTG CCAAGCTGGT TGAAACCGCT 
ACCGACATCC TGGAGGAGCT GGGCAGTTTC AACGCAGCTC CCGCAGCAGA CATCCCATCG 
GATAAGGCCG ATGAAGGGCC GATTCTCACT GCACTTGGCC ACGATCCATG CAGCCTTGAC 
GACCTCGTCG AACGAACCAC CATGAGCGCC GATCAGTTAC TGCCGGAACT CCTGACACTG 
GAGCTTTGCG GCCTGATCGC CACCCTGCCC GGTAACCGCT ACCAGCGCCT GAACTAG

Protein sequence

MSHNDSLAAW LRLTLIPGIG GETQRKLLAA FGLPEAIFSA GRLEARGVIG NRADLLFDFD 
PTEAVAHSLE WARQPGQHII SLADEAYPKA LLEIADPPSL LYVRGNLALL QKRGLAMVGS 
RNATPQGVQT AENFAKTLAA KGLTIISGLA LGIDAAAHRG ALAAKGETIA VIGTGPDRIY 
PARNKELALA IVESGAIVSE FPLGTPAIAS NFPRRNRIIS GLSCGVLVVE AAPESGSLIT 
ARLAAEQGRE VFAIPGSIHS PVARGCHKLI KQGAKLVETA TDILEELGSF NAAPAADIPS 
DKADEGPILT ALGHDPCSLD DLVERTTMSA DQLLPELLTL ELCGLIATLP GNRYQRLN