Gene TM1040_2338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2338
Symbol
ID	4078328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2458080
End bp	2459228
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	62%
IMG OID	638007660
Product	DNA processing protein DprA, putative
Protein accession	YP_614332
Protein GI	99082178
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAG AAGCATATTC TTCCACTCAC CCCCCACTCC CACCCACCAC GGAAGATCAA 
AGGTATTCCT GGCTTCGCCT GTTGCGCTCC CGAGGCATCG GGACCGTGAC CTTTTATCGG 
CTTCTGGCCG AGTATGGTTC AGCACAGAAT GTGCTTGAAA AGCTGCCTGA ATTGGCAGCG 
ACTTCAGGCG TCAAAGGGTA TAAAATATAC TCAAAAGATG CATTGGACGC CGAGTTCGAG 
AACGCAAAAG CCGCCAATGC GCGGCTTTTG TGCATTGGAG ATCCCCATTA TCCGGCCCCG 
TTGGCCTCGC TTCCCAATCC TCCTCCGGCA CTCTGGGCGA TCGGAAATTT GTCGCTTGTG 
ACGCGACCGG CCATTGCACT GGTGGGCGCA CGCAACGCGT CCTCCTTGGG GCGGCGCATG 
GCCTATGGGC TGGCGCGAGA TCTGGGCGAT GCCGGATATG TGGTGGTCTC GGGACTTGCG 
CGCGGCATCG ATGCCTGTGC CCACGAGGGT GCCCTTGCCA GCGGCACCAT CGCTGTGCAG 
GGCGGCGGCG TCGACATTAT ATATCCCTCT GAGAACACCC CGCTCGCCAT GACCCTTGCC 
GAGCAGGGTC TGCGCCTCTC CGAACAACCC ATGGGCTTGC AGCCACAAGC GCGCCATTTT 
CCGCCCCGCA ACCGCATCAT AGCAGGTCTC GCCCTTGCAA CAGTGGTCGT GGAGGCCGCC 
ATAAAGTCAG GGAGCCTCAT CACTGCGCGC GATGCGCTGG ATTTGGGACG GGACGTGATG 
GCAGTACCTG GCCACCCCTG CGACGGGCGG GCCAGCGGTG GCAACCTCTT GATCCGCGAT 
GGCGCCACGC TGGTGCGCCA CGCCGAGGAC GTGATCGAGG CGCTACCTCC GCTCAATGCG 
CACCGCCCGC CCCAACGCCC CTCGGTGCAG GACCTGCCCT CGCCCCCGCC CGAGCGACGC 
AACCTGCGTC AAACCGCAGC ACTGCATCAA CAAATCCTGG ATCGCCTCGC GGCCGCGCCC 
ACACCGGAAG GCCAGTTGAT CAAGGATCTC GGCAGCCCCG CACGCAAGGT GCGCACGGTG 
CTGACGGACT TGGAGCTATC CGGCGAAATC GGTCGGGAAC CGGGTGGAGT GATCATCAAA 
AAACGCTAA

Protein sequence

MTGEAYSSTH PPLPPTTEDQ RYSWLRLLRS RGIGTVTFYR LLAEYGSAQN VLEKLPELAA 
TSGVKGYKIY SKDALDAEFE NAKAANARLL CIGDPHYPAP LASLPNPPPA LWAIGNLSLV 
TRPAIALVGA RNASSLGRRM AYGLARDLGD AGYVVVSGLA RGIDACAHEG ALASGTIAVQ 
GGGVDIIYPS ENTPLAMTLA EQGLRLSEQP MGLQPQARHF PPRNRIIAGL ALATVVVEAA 
IKSGSLITAR DALDLGRDVM AVPGHPCDGR ASGGNLLIRD GATLVRHAED VIEALPPLNA 
HRPPQRPSVQ DLPSPPPERR NLRQTAALHQ QILDRLAAAP TPEGQLIKDL GSPARKVRTV 
LTDLELSGEI GREPGGVIIK KR