Gene Cpha266_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1961
Symbol
ID	4570136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	2274228
End bp	2275634
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	53%
IMG OID	639766542
Product	deoxyribodipyrimidine photo-lyase type II
Protein accession	YP_912398
Protein GI	119357754
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.351083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAC ATCGGCTGAC ACAAAAACAG AACGCCCTTA TGATTGATCC CCGCCGAACA 
AGAGTGTTGA ACTCCTGCAG TGACAAACCG GGAGCGGTTA TTTACTGGAT GTCGCGCGAT 
CAGCGCCTGA ACCATAATTG GGCGCTGCTC TTTGCAAGAG AGAAAGCCGC TCGGAAAGGC 
CAGCCTCTTG TTGTTGTCTT CGCTCTGGCC CCATCATTCC TCGACGCTCC GTTCAGACAT 
TACGACTTCA TGCTTAAAGG TCTTGAAGAA ACCTCCAAAG CTCTCGAACG GATCAATATC 
CCCTTTATGC TGCTCGAAGG AGAGCCGGAT ACAGAGATCT CACGATATGC CTGCCAGTCC 
GAAGCAGGAG CTGTCGTTAC GGATTTTTCT CCCCTGAACA TTTCCCGAAA CTGGAAAAAA 
AAGGCAGCCG ACATCCTCGA CATTCCTCTC TATGAGGTCG ATGCCCATAA CATTGTCCCC 
TGCTGGTATG CATCCGACAA ACAGGAGTAT GCGGCCAGAA CCCTGCGCCC GAAACTGCAG 
GCCCGCCTTG ATGAGTTTCT TGTTCCGTTT CCAACGATTC TGCCGCTTCC GGCACCTCAC 
GTTCACCACC GCTCTCCCGA CTGGAAACAG GTCCGGGAAC GGCTCCAAAA AGATCGCTCC 
GTACCGCCGG TGAACCGGAT CGCTCCTGGA GAAACGGCCG CAGCAGAATC GCTTGAAAAC 
TTCATCAAGA GCAGGCTTTC GGGATATGCC ACGGCTAGAA ACGACCCGAA CAGCAATGCC 
CTGTCACAAC TCTCTCCCTA CCTTCATTTC GGTCAGATCA GTGCCCAGCA TGTTGCGTTG 
CGGGTTGCCG AAAGCCGTGC GCCACAGAAA GACAAGACGG CCTTTCTCGA GGAGCTGATT 
ATCCGCAGGG AGCTTTCGGA TAATTTCTGC AACTACAACC CGAGCTATGA CCGGTTTGAA 
GGGATCCCTG CATGGGCGAA GCAAACGCTG CTTCTTCATG GGCAGGACAA ACGGGAGTAC 
CTGTACACCA TCGACGTTTT CGAAAAAGCT GCAACGCACG ACAAGCTCTG GAACGCTGCC 
CAATCAGAGC TGGTTCAAAG CGGAAAAATC CACGGTTATA TGCGGATGTA CTGGGCGAAA 
AAAATTCTCG AATGGAGTTC GTCTCCTCCC GAGGCATTTG AGATGGCGAT CTATCTCAAC 
GACCGATATG CGCTTGATGG AAGGGATCCT AACGGTTATG CTGGGGTGGC ATGGTCGATT 
GGAGGCTTGC ATGACCGCCC ATGGTTCGAA CGTCCGGTCT ATGGCAACAT CAGATACATG 
AACGCCAGCG GGTGCAGAAG AAAGTTCGAC GTTGAGCGCT ACATAAGCCG GTTTCGGGAA 
CCGGCGACAC TGTTCCCGAA TGCGTAA

Protein sequence

MSEHRLTQKQ NALMIDPRRT RVLNSCSDKP GAVIYWMSRD QRLNHNWALL FAREKAARKG 
QPLVVVFALA PSFLDAPFRH YDFMLKGLEE TSKALERINI PFMLLEGEPD TEISRYACQS 
EAGAVVTDFS PLNISRNWKK KAADILDIPL YEVDAHNIVP CWYASDKQEY AARTLRPKLQ 
ARLDEFLVPF PTILPLPAPH VHHRSPDWKQ VRERLQKDRS VPPVNRIAPG ETAAAESLEN 
FIKSRLSGYA TARNDPNSNA LSQLSPYLHF GQISAQHVAL RVAESRAPQK DKTAFLEELI 
IRRELSDNFC NYNPSYDRFE GIPAWAKQTL LLHGQDKREY LYTIDVFEKA ATHDKLWNAA 
QSELVQSGKI HGYMRMYWAK KILEWSSSPP EAFEMAIYLN DRYALDGRDP NGYAGVAWSI 
GGLHDRPWFE RPVYGNIRYM NASGCRRKFD VERYISRFRE PATLFPNA