Gene TM1040_3370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3370
Symbol
ID	4075269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	381777
End bp	383009
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	61%
IMG OID	638004878
Product	deoxyribodipyrimidine photo-lyase family protein
Protein accession	YP_611604
Protein GI	99078346
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.455231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACAC AAGAACCGCA AATAGGCCCC GCGACACGCG CCGAAGCTCT GCTGCGAATG 
GAGGCATTCA CGCCGCGCAT GGGGCTCAAC TACGCGACAT TTCGCAACCA TGACTATGGG 
CCTCAACGTC AAAGCGCTGT GTCGATGTTA TCGCCCTATC TTCGCCGTCG CCTCCTGACC 
GAGCCGGAAG TGATTGCGGC AGCCTTGGCG GCACACGGAC CTCAGGAGGC AGACAAATTC 
GTCCAAGAAG TCCTGTGGCG CGGCTATTTC AAGGGATGGA TGGAGCGGCG ACCGGAGGTC 
TGGGCAAACT ATATCACCGG GCGCGATGCG GACTTCGTCG CCCTTGAAGA GGATCCGGGG 
TTGGCGATAC GCGTGAATGC TGCAGAAACG GGTGAGACCG GTCTTGCCTA TTTCGATACC 
TGGGCCAAGG AGCTGGTGCG CACAGGGTAT CTGCACAATC ACGCGCGGAT GTGGTTTGCG 
TCGCTTTGGA TCTTCACGCT CAAGCTGCCG TGGCGGTTGG GAGCAGATTT CTTCCTTCGA 
CACTTGCTGG ACGGCGACCC CGCGTCGAAC ACTTGTTCGT GGCGCTGGGT GGCAGGACTT 
CATACGCGGG GCAAGCCCTA CGTGGCGCAA GCCTCGAATA TCGCGCGGTT CAGTGGTGGG 
CGATTTGCGC CCCAGGAGAG TGAGCTCGCA ACAGAAGTGA CTGGCCTGAT GGACGAAGAA 
CCAGAGGGGC TTCCGCACGT GAACCCCTTG CGATCTGTCC TCTCCCCTGA AGAAGCAAAG 
CCGACTGCGG TTCTTTTGAC CGAAGAAGAC TGTATGCCTG CGTCAGCGGA TCTTGCGTCA 
CTGGATATTC GGGGGGCGGC ACGCCTATAT TGCAGTCACC TGCGCTCGCC ACGCAGGGTG 
GCCGCCGCCG TGTCAACATT CGAGGAGGAT GCTCTGGCAG ATACCGTTGC GCGCATAGGT 
CTGGATGCAC AGCCCTGGGC GGCGTCGGAG CCAGAGGCGC TGGCTGATTG GGTGCAGTCG 
ATTGGGGCGC AGCAGATCTT CATGCCCTAT GCAACGGTCG GCCCGCTGGG AGACTGGATT 
GCGCGGGCGC TGCCTTTGTT GCGGGCTCGG GGGGTCGCGG TAGCGGAATG GCAACGGGAT 
TGGGACGGGC TGGTGTGGCC ACATGCAACG GCCGGGTTTT TCAAGGTCAA AAAGCGCTTG 
CCTGACATCC TGACCAAGGC CGGGCTGACA TGA

Protein sequence

MATQEPQIGP ATRAEALLRM EAFTPRMGLN YATFRNHDYG PQRQSAVSML SPYLRRRLLT 
EPEVIAAALA AHGPQEADKF VQEVLWRGYF KGWMERRPEV WANYITGRDA DFVALEEDPG 
LAIRVNAAET GETGLAYFDT WAKELVRTGY LHNHARMWFA SLWIFTLKLP WRLGADFFLR 
HLLDGDPASN TCSWRWVAGL HTRGKPYVAQ ASNIARFSGG RFAPQESELA TEVTGLMDEE 
PEGLPHVNPL RSVLSPEEAK PTAVLLTEED CMPASADLAS LDIRGAARLY CSHLRSPRRV 
AAAVSTFEED ALADTVARIG LDAQPWAASE PEALADWVQS IGAQQIFMPY ATVGPLGDWI 
ARALPLLRAR GVAVAEWQRD WDGLVWPHAT AGFFKVKKRL PDILTKAGLT