Gene TM1040_2281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2281
Symbol
ID	4078465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2398532
End bp	2400055
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	61%
IMG OID	638007603
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_614275
Protein GI	99082121
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.558867
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGGC TTGTTTTGGT GCTGGGGGAC CAGCTTTCAG AAGGGTTGTC GGCGCTCAAA 
GCGGCAGACC CTGCACATGA TGTGGTGGTG ATGGCGGAGG TGATGGACGA GGGCACATAT 
GTCCCGCATC ACCCCAAGAA GATCGCGTTG GTGCTGGCGG CGATGCGCAA GTTTGCGCAG 
CGTCTAGAAG GGCAGGGCTG GCGTGTGGCC TATCGGCGTC TGGACGAGGA TGGCGCGGAG 
AGCATCGTGG GCGAACTCTT GCGCCGGGCC GAAGAATTTG GCGCCTCGGA GGTGCTGGCC 
ACCACGCCGG GCGAGTGGCG GCTGATCCAC GCGTTGAAAT ATGCCCCCCT CAAGGTTCAT 
TTTCATGCCG ACGACCGCTT TCTCGCCACG CGCGAGGATT TCACCGAGTG GGCCGAGGGC 
AAAAAACAGC TCCGGATGGA GTATTTCTAT CGCCTGATGC GCAAGAAAAC CGGCCTTCTG 
ATGGAGGGAG ACACCCCGGT TGGCGGCAAG TGGAATTACG ATTCAGAGAA CCGCAAGGCG 
CCCCCCAAGA TCATCGACCA CAAGGGGCCA CCCCGGTTTG AACCGGACGC CGAGGTCGAG 
GAGGTGCTGG ATCTGGTGGA GGCGCGCTTT GGCACTCATT TCGGGGATCT GCGCCCGTTC 
TGGTTTGCCA CAACCCGCGA AGAAGCGCAG GAGGCGCTTG CGCATTTCAT CACCCACGCT 
CTGCCGCAGT TCGGGGACTA TCAGGATGCG ATGATGACGG ATGAGCGCTG GCTCTATCAC 
TCCATCCTGT CGCCCTATCT CAACATCGGT CTGTTGACCC CGCTGGAGAT CTGCGAGGCG 
GCCGAGGTCG CACATCAGGA CGGCCATGCG CCGCTCAATG CGGTCGAAGG TTTCATCCGG 
CAGATCCTCG GGTGGCGGGA GTATGTGCGG GGGATCTATT TCCTCGAGGG GGAGGATTAC 
CCCACGCGCA ACGCACTGGA ACAAACCCGA GCGCTGCCCG CGCTCTATTG GGGGGCGGAG 
ACGGACATGC ATTGCCTCTC GCAAGCGGTG GAGCAGACCG GGCAGGAGGC CTACGCCCAC 
CACATCCAGC GGCTGATGGT GACCGGGAAT TTTGCGCTTT TGGCCGGGGT TGATCCGGCA 
CAGGTGCACG AATGGTATCT CGCAGTGTAT GCAGATGCGT TTGAGTGGGT CGAGGCGCCC 
AACACCGTCG GCATGAGCCA GTTTGCCGAT GGCGGCATCA TTGCCTCCAA ACCCTATGTC 
TCCAGCGGTG CCTACATCGA CAGAATGTCC AATTATTGCG GAAGTTGCGC CTATAAGGTG 
AAGCAAAAAA CGGGCGAGGG CGCCTGTCCG TTCAACCTGC TGTACTGGGA TTTCCTGAAC 
CGCCACCGGG CACGGTTTGA GGGCAACCCG CGCATGGGCA ACATGTATCG CACCTGGGAC 
CGGATGGACG AAGAGAAACG CGATGTGATT TTGCAGGAAG CGAGCGCGTT CCTCGCAAAA 
CTTGACGCGG GCGAAAGAGT TTAG

Protein sequence

MTRLVLVLGD QLSEGLSALK AADPAHDVVV MAEVMDEGTY VPHHPKKIAL VLAAMRKFAQ 
RLEGQGWRVA YRRLDEDGAE SIVGELLRRA EEFGASEVLA TTPGEWRLIH ALKYAPLKVH 
FHADDRFLAT REDFTEWAEG KKQLRMEYFY RLMRKKTGLL MEGDTPVGGK WNYDSENRKA 
PPKIIDHKGP PRFEPDAEVE EVLDLVEARF GTHFGDLRPF WFATTREEAQ EALAHFITHA 
LPQFGDYQDA MMTDERWLYH SILSPYLNIG LLTPLEICEA AEVAHQDGHA PLNAVEGFIR 
QILGWREYVR GIYFLEGEDY PTRNALEQTR ALPALYWGAE TDMHCLSQAV EQTGQEAYAH 
HIQRLMVTGN FALLAGVDPA QVHEWYLAVY ADAFEWVEAP NTVGMSQFAD GGIIASKPYV 
SSGAYIDRMS NYCGSCAYKV KQKTGEGACP FNLLYWDFLN RHRARFEGNP RMGNMYRTWD 
RMDEEKRDVI LQEASAFLAK LDAGERV