Gene EcE24377A_0733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0733
Symbol	phrB
ID	5586035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	759751
End bp	761169
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	53%
IMG OID	640924448
Product	deoxyribodipyrimidine photolyase
Protein accession	YP_001461868
Protein GI	157154932
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACCC ATCTGGTCTG GTTTCGCCAG GATTTACGTC TGCACGATAA TCTCGCACTG 
GCTGCCGCCT GCCGCAATTC GTCTGCACGC GTGCTGGCGT TATATATCGC TACACCACGC 
CAGTGGGCGA CGCATAACAT GTCGCCGCGT CAGGCTGAAC TTATCAATGC TCAACTGAAT 
GGGCTACAAA TAGCGCTTGC GGAAAAAGGT ATTCCTTTAT TGTTCCGTGA AGTGGATGAC 
TTTGTCGCCA GTGTCGAAAT AGTTAAACAG GTGTGCGCGG AAAACAGCGT TACCCACCTG 
TTTTATAACT ATCAGTATGA AGTGAATGAG CGGGCGCGGG ATGTGGAAGT TGAAAGAGCG 
CTGCGTAACG TGGTGTGTGA AGGATTTGAT GACAGCGTGA TCCTGCCGCC TGGCGCGGTG 
ATGACCGGTA ATCACGAGAT GTACAAAGTC TTTACGCCTT TTAAGAATGC CTGGCTGAAA 
CGGCTGCGGG AAGGGATGCC GGAGTGTGTC GCTGCGCCAA AAGTTCGTAG TAGCGGATCG 
ATAGAGCCCG CGCCATCCAT TACGCTGAAT TATCCTCGTC AGTCTTTCGA TACTGCGCAT 
TTCCCGGTGG AAGAAAAAGC GGCGATTGCG CAATTACGCC AGTTTTGCCA GAACGGTGCC 
GGAGAATATG AGCAACAACG AGATTTTCCG GCAGTGGAAG GCACCAGTCG TTTGTCCGCC 
AGCCTGGCAA CGGGCGGGTT ATCGCCTCGC CAGTGTTTGC ATCGCTTGTT GGCGGAACAG 
CCGCAGGCGC TGGACGGTGG GGCCGGTAGT GTCTGGCTTA GTGAGCTGAT CTGGCGCGAG 
TTCTACCGTC ATCTGATGAC GTATTACCCC TCGTTGTGTA AACATTGTCC GTTTATTGCC 
TGGACGGATC GTGTGCAGTG GCAAAGCAAT CCCGCACATT TACAGGCCTG GCAGAAAGGC 
AAAACGGGAT ACCCGATTGT TGATGCCGCT ATGCGTCAGC TTAACAGCAC TGGCTGGATG 
CATAACCGGC TACGGATGAT TACAGCCAGT TTTCTGGTGA AAGATTTGTT GATCGACTGG 
CGCGAAGGCG AGCGATATTT CATGTCGCAG CTGATTGATG GTGATTTGGC AGCTAATAAC 
GGTGGCTGGC AGTGGGCGGC TTCTACGGGT ACTGATGCTG CGCCGTATTT TCGTATTTTC 
AATCCGATAA CTCAGGGCGA GAAATTTGAT CGCGAAGGTG AGTTTATCCG CCGATGGTTA 
CCGGAGCTGC GCGATGTACC AGGGAAAGCG GTGCATGAGC CGTGGAAGTG GGCGCAGAAA 
GCAGGTGTGA AGCTGGATTA TCCGCAACCG ATAGTTGATC ACAAAGAGGC AAGGCTGCGA 
ACGCTGGCAG CGTACGAAGA AGCGAGGAAA GGAGCCTGA

Protein sequence

MITHLVWFRQ DLRLHDNLAL AAACRNSSAR VLALYIATPR QWATHNMSPR QAELINAQLN 
GLQIALAEKG IPLLFREVDD FVASVEIVKQ VCAENSVTHL FYNYQYEVNE RARDVEVERA 
LRNVVCEGFD DSVILPPGAV MTGNHEMYKV FTPFKNAWLK RLREGMPECV AAPKVRSSGS 
IEPAPSITLN YPRQSFDTAH FPVEEKAAIA QLRQFCQNGA GEYEQQRDFP AVEGTSRLSA 
SLATGGLSPR QCLHRLLAEQ PQALDGGAGS VWLSELIWRE FYRHLMTYYP SLCKHCPFIA 
WTDRVQWQSN PAHLQAWQKG KTGYPIVDAA MRQLNSTGWM HNRLRMITAS FLVKDLLIDW 
REGERYFMSQ LIDGDLAANN GGWQWAASTG TDAAPYFRIF NPITQGEKFD REGEFIRRWL 
PELRDVPGKA VHEPWKWAQK AGVKLDYPQP IVDHKEARLR TLAAYEEARK GA