Gene Arth_2747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2747
Symbol
ID	4444594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3088509
End bp	3089933
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	67%
IMG OID	639690567
Product	deoxyribodipyrimidine photo-lyase type I
Protein accession	YP_832226
Protein GI	116671293
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00995843
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCCA CCATTGTCTG GCTCCGTGAC GACCTTCGGC TCGATGACAA TCCGGCCCTG 
GCCGATGCGG CGGCCATGGG CCACCCGCTG ACCGTCGTCT ACATTCTGGA TGAAGAATCA 
CCGGGGGTGC GGCCCCTCGG CGGGGCGGCC AAATGGTGGC TCCACCATTC ATTGGTGTCC 
TTGGCCGGCG GTCTGGAAGC GGCAGGCTCC CGACTGGTCC TTCGACGCGG GAGCGCTGCA 
GGAATCATCC AGGAGCTGGC TGCCGAAACC GGAGCCACCC ATCTCAGGTG GAACCGCAGG 
TACGGCGGAC CTGAACGCAG CATCGACGCC GGCGTCAAAG CCTGGGCAGG GGAACAGGGA 
CTTGATGCAG CGAGCTTCCA GGCCAGCCTC ATGTTCGAGC CCTGGACCGT CCGCACCGGG 
GCGGGCGGGC CGTACAAGGT CTTCACGCCC TTCTGGCGCG CATGCCTCGA AAGCGGAGAG 
CCGCGGATCC CCTCCGACGG CCCCGGCACG TTGCCTCATC CCGCCGGGCA CGGAGACGGC 
GGGCCGCCCC AAAGCGATGA CCTGGACAGC TGGGCGCTTC TCCCCCGCAC GCCCGACTGG 
AGCGCAGGAC TCGCGGAACA GTGGACGCCC GGCGAAGCGG GCGCCCACAG CCGTCTGAAG 
GACTTCCTGG ACGGCCCTGT CGAGGAGTAT GGAACCGGCC GCGACCGGCC GGGAGTCGAA 
GGCACCAGCC GCCTCTCCCC CCATCTTCGC TTTGGTGAGA TCAGTCCCTT CCGCATCTGG 
CACGCGCTCC GTGAGCGCTT CCCGCGCCAG GCTCCTGCCG ACGTCGGAAT CTTCCGCTCC 
GAACTGGGCT GGCGCGAGTT TTGCTGGCAG CTTCTCTACG AGAACCCGGA GCTGGCCAGC 
CGAAACTACC GTCCCGACTT TGACCGGTTC GAATGGCAGA CGCCGTCGGA CGCCGAACTG 
GAAGCCTGGC AGCAGGGCCG GACAGGCTAT CCGCTGGTGG ACGCCGGGAT GCGCCAGCTG 
TGGCAGACGG GTTGGATGCA CAACCGCGTC CGCATGGCCG CCGCGTCGTT CCTGGTGAAG 
AACCTGCTCG CGGACTGGAG GCTGGGCGAA GCCTGGTTCT GGGACACGCT GGTGGACGCC 
GATTCCGCAA GCAACCCGGC CAACTGGCAA TGGGTGGCGG GCTCCGGAGC GGACGCCTCC 
CCCTATTTCC GGATCTTCAA CCCCGTGACG CAAAGCAAGA AATTCGACGC CGCCGGCCGC 
TACCTGCGGG AGTTCATTCC GGAGATCGCG AACCTGAGTG AAAAAGAGAT CCACGAACCG 
TGGAAGGCGC CGGAACTGGC CGCCGGTTAT CCGGAGCCGT TGGTGGGCCT GCCCGAGTCG 
CGTGAGCGGG CCCTGGAGAC ATACCAGAAG CTCAAGGACA GCTAA

Protein sequence

MPSTIVWLRD DLRLDDNPAL ADAAAMGHPL TVVYILDEES PGVRPLGGAA KWWLHHSLVS 
LAGGLEAAGS RLVLRRGSAA GIIQELAAET GATHLRWNRR YGGPERSIDA GVKAWAGEQG 
LDAASFQASL MFEPWTVRTG AGGPYKVFTP FWRACLESGE PRIPSDGPGT LPHPAGHGDG 
GPPQSDDLDS WALLPRTPDW SAGLAEQWTP GEAGAHSRLK DFLDGPVEEY GTGRDRPGVE 
GTSRLSPHLR FGEISPFRIW HALRERFPRQ APADVGIFRS ELGWREFCWQ LLYENPELAS 
RNYRPDFDRF EWQTPSDAEL EAWQQGRTGY PLVDAGMRQL WQTGWMHNRV RMAAASFLVK 
NLLADWRLGE AWFWDTLVDA DSASNPANWQ WVAGSGADAS PYFRIFNPVT QSKKFDAAGR 
YLREFIPEIA NLSEKEIHEP WKAPELAAGY PEPLVGLPES RERALETYQK LKDS