Gene Franean1_7233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7233
Symbol
ID	5675534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8831178
End bp	8832407
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	75%
IMG OID	641246070
Product	deoxyribodipyrimidine photo-lyase
Protein accession	YP_001511458
Protein GI	158318950
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.172483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.496846
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGGTGGC TTCGCCGTGA CCTCCGCCTC GACGACAACC CGGCGCTGCT CGCCGCCGCC 
GAGTCCGGCC GGGTGCTGGC TCTCTTCGTC CTCGACGACG CGCTGCGGCG CCCGTCCGGT 
CCCGTCCGCC TGGCGTTCCT CCACCGGTGC CTGCGCGACC TGGACGCCCA GCTCGGCGGC 
CGGCTGTGCG TGCGCACCGG CTCGCCCTAC GCGGTAGCGC CCGGCCGCCT GCGCAAGGCC 
GACGGGACGT CCTACCGGGT GTTCACGCCC TTCTACCGGG CCTGGAAGGA ACACGGCTGG 
CGCGGGCCGG CCATCCCGGC GGATCCGGTC TGGCTCCAGC CCGCCGACCT CGACGGCGGC 
AGCGAACCGA TCCCGGCGGA TCCGGAGCTC GGGGGCACCG AGCTACCCCC GGCCGGCGAA 
CACGCCGCGC ACGAGCGCCT GCGCGCCTTC CTGACCGAAT CGCTGGCCGG CTACGCGGCG 
CACCGCGACG AGCCGGCCGC GGCCAGCGAA TCGGGAGACG CCGTACCCGG CTGGTCCGGG 
GCCAGCCGGG CTGGCGGGGC CGGTGGCGCT GGCGGGGCTG GCGGGGCCGA TGCGGCTGGC 
GGGGGCGGCG GGCTGGCCGG TTCGGCCGAG AAGTTCCGCT CCGAGCTCGC CTGGCGGGAG 
TTCTACGCGG ACGTCCTCGC CGGCACCCCC TCGTCGGCCC GGACCGACCT CACCGACACC 
CTGGCCGCGT TGGCCTACGA GCCTCCCGGT GACACCTTCG AGGCGTGGAA GTGGGGCCGC 
ACCGGTTACC CGATCGTCGA CGCCGGCATG CGCCAGCTCC TCGCCGAGGG CTGGGTGCAC 
AACCGGGTCC GGATGATCGA GGCCTCGTTC GTCTGCAAGG ACCTGAACGT CCACCGGACG 
CACGGCGCCC GCTGGTACCT CGAGCGCCTC GTCGACGGCG ACCTCGCGTC CAACAACCAC 
GGCTGGCAGT GGACGGCCGG CACCGGAACC GACGCCGCCC CGTACTTCCG GGTCTTCAAC 
CCCGTCTCGC AGGGGCGCAA GTTCGATCCC GCCGGGGAGT ACATCCGCCG ATGGGTCCCC 
GAACTGCGCG GCCTCCCGCC CGACGCGGTG CACGAGCCGT GGAAACTCCC GGCCGGCCCG 
CCGAACGGCT ACCCACGCCC AGTCGTCGAT CACGCTGTCG AACGCCGGGA GGCCCTCGAC 
CGCCACGCCC GAGCCCGACA CCACGACTAA

Protein sequence

MWWLRRDLRL DDNPALLAAA ESGRVLALFV LDDALRRPSG PVRLAFLHRC LRDLDAQLGG 
RLCVRTGSPY AVAPGRLRKA DGTSYRVFTP FYRAWKEHGW RGPAIPADPV WLQPADLDGG 
SEPIPADPEL GGTELPPAGE HAAHERLRAF LTESLAGYAA HRDEPAAASE SGDAVPGWSG 
ASRAGGAGGA GGAGGADAAG GGGGLAGSAE KFRSELAWRE FYADVLAGTP SSARTDLTDT 
LAALAYEPPG DTFEAWKWGR TGYPIVDAGM RQLLAEGWVH NRVRMIEASF VCKDLNVHRT 
HGARWYLERL VDGDLASNNH GWQWTAGTGT DAAPYFRVFN PVSQGRKFDP AGEYIRRWVP 
ELRGLPPDAV HEPWKLPAGP PNGYPRPVVD HAVERREALD RHARARHHD