Gene TM1040_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1784
Symbol
ID	4076813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1877394
End bp	1878758
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	63%
IMG OID	638007099
Product	DNA repair protein RadA
Protein accession	YP_613779
Protein GI	99081625
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1066] Predicted ATP-dependent serine protease
TIGRFAM ID	[TIGR00416] DNA repair protein RadA

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.199022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA CAACATTCTC CTGCTCCGCC TGCGGGGCCT CCTATTCCAA ATGGTCCGGT 
CGCTGCGAGG GCTGCGGTGA GTGGAATACG ATTTCCGAAG ACAAGGGGCT GAGCTCTGGA 
GGACCGGCCA AGAAGTCCCT TGGCGCAATG CGCGGCAAAC GACTGGCGCT GAGCGATCTG 
GCCACGCAAG AGACGCCTCC TCCGCGCACC CTTTGTGGTG TGGCAGAGCT TGATCGCGTC 
CTTGGAGGCG GCCTGGTCGA TGCGTCGGCC ATCCTCGTGG GGGGCGATCC CGGGATCGGT 
AAATCCACGC TGCTGTTGCA AGCTGCGGCG CAATTTGCAC ACGCAGGCCT GAAGACGGTC 
TATGTTTCGG GAGAGGAAGC CTCGGCGCAG GTACGGATGC GCGCCCAGCG TCTGGGACTG 
GCACAAGCCC CTGTCAAGCT CGCGGCGGAA ACCAACCTGC GCGATATTCT CACCACGCTT 
GAGGCGGAAA AACCCCAGCT GGCCATTATC GATTCGATCC AGACCATGTG GGCCGACAAT 
GTGGACAGTG CGCCGGGATC CGTCAGTCAG GTGCGCGCGG CGGCCCATGA GCTGACCACT 
TTTGCCAAGA CCAATGGTGT CAGCATCATC ATGGTGGGCC ATGTCACCAA GGAAGGCCAG 
ATCGCCGGGC CTCGCGTGGT CGAACATATG GTCGACACGG TCTTGTATTT CGAGGGCGAG 
CGCGGCCACC AGTTCCGCAT CCTGCGTGCC GTGAAGAACC GCTTTGGCCC TGCCGACGAG 
ATTGGCGTCT TTGAGATGAC CGGCGGCGGG CTGGCGCAAG TGGTGAACCC TTCGGCCCTG 
TTTCTGTCCG AACGCGGCCA GCCCTCGCCC GGATCGGTGG TCTTTGCCGG TATCGAAGGC 
ACCCGTCCGG TCCTCGTGGA AATGCAGGCG CTGGTGGCGC CTTCGCCCCA TTCGCAGCCC 
CGCCGCGCTG TGGTGGGCTG GGACAGCTCG CGCCTTGCGA TGATCCTCGC CGTTCTGGAG 
GCGCGCTGTG GCATTCCTTT TGCCGGGCTT GATGTCTATC TCAATGTTGC GGGCGGCATG 
AAAATCTCTG AACCCGCGGC CGACCTGGCG GTGGCGGCCG CCCTCCTTAG TGCACGCGAG 
GACACCGCCC TGCCCGCCGA TACGGCAATA TTTGGCGAAA TATCCCTATC TGGCGCGCTC 
AGACCGGCCC CTCAGACCGA AAACCGGTTG AAAGAGGCGC AAAAACTTGG TTTCACGGCA 
GCGATCGCTC CGAGCGGTGG CAAAACTGTT TCTGTCCCCG GCCTGACCCT GCGCCCGGCC 
GCCGACCTCA CAGGATTTGT TGGCGAATAT TTCGGAGCAG GCTAA

Protein sequence

MAKTTFSCSA CGASYSKWSG RCEGCGEWNT ISEDKGLSSG GPAKKSLGAM RGKRLALSDL 
ATQETPPPRT LCGVAELDRV LGGGLVDASA ILVGGDPGIG KSTLLLQAAA QFAHAGLKTV 
YVSGEEASAQ VRMRAQRLGL AQAPVKLAAE TNLRDILTTL EAEKPQLAII DSIQTMWADN 
VDSAPGSVSQ VRAAAHELTT FAKTNGVSII MVGHVTKEGQ IAGPRVVEHM VDTVLYFEGE 
RGHQFRILRA VKNRFGPADE IGVFEMTGGG LAQVVNPSAL FLSERGQPSP GSVVFAGIEG 
TRPVLVEMQA LVAPSPHSQP RRAVVGWDSS RLAMILAVLE ARCGIPFAGL DVYLNVAGGM 
KISEPAADLA VAAALLSARE DTALPADTAI FGEISLSGAL RPAPQTENRL KEAQKLGFTA 
AIAPSGGKTV SVPGLTLRPA ADLTGFVGEY FGAG