Gene Franean1_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3000
Symbol
ID	5671383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3529772
End bp	3530974
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	641241903
Product	glyoxalase/bleomycin resistance protein/dioxygenase
Protein accession	YP_001507323
Protein GI	158314815
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCCAG AGCCAGTGAC CAGGCGGCCC TCGGCGACCG CAGACCTGGC GACGCGGCAG 
TCGACCGGTG TGCGGCCGTC TCTGCCCATC GCCGCGGGAG GCCTTGGCAG TGGCCATCCG 
GGCCGGGCCA AGAGCCCTGT CGTGAAGGTG GTGGATCTGG CCTTCCTGGA GTTCGAACGG 
CCGGACCTCG ACCGTTCCGA GGCATTCGCC CGAGATTTCG GGTTTGCCGT GGCGCAGCGG 
ACACCGGACA CGTTGATGTT GCGGGGGATC CTGTCCGGGG GCCCGTGCAT GATGATCCGC 
CGCAGTACGG CGGCGCGGTT CGTCGGGCCG GCGTTCGCGG CCGCTGACGC CACAGACCTG 
AACCGGCTTG CCCAGGCCAC CGACGCAACG GTCCGCGACC TCGCTACGGC GGTCCCCGCC 
TTCGGCGGTG GGATCCTCGA CGGTGCCACA GCCGTCGAGC TGCGTGACCC CACCGGACTG 
CCGGTACGGG TGGTGCACGG AATACCGGAG CTGCCGGCGC TGGACGAACA ACACCCACTG 
GTCTTGAATG TCGGATCCCA GACACCGAGA GTGAATCTGA CCCAACGCCC ACCCCGAGAG 
CCGGCCCGTG TCCAGCGGCT GGGACACCTC GTGCTGGAGT CCCCGGTCTT CGGCCGCGCA 
CTCGACTGGT ACCTGCAGAC TCTCGGCCTG ATCGTCAGCG ACTTCCTCTT CCTCGACGGC 
CAGCGCGACC GCGGCCCGAC GATGGCGTTC ATCCGGTGCG ACCAGGGCCG CCGGCCGGTC 
GACCACCACA CACTGGCGAT GCTGCTTGGC CCGAGCGGCG GCTACGTCCA CTCCGCATAT 
CAGGTCAGCG ACCTCGACGC GCTTGCCGCC GGCGGCGAGT ACCTGCGGGA ACGAGGCTGG 
CGACGCAGCT GGGGAATAGG CCGGCACATC CAGGGCAGCC AGATCTTCGA CTACTGGCGG 
GACCCGGATG GCTTCCTGGT CGAGCACTTC ACCGACGGCG ATCTTTTCGA CGCCTCCACC 
GAACCCACCT GGACGCCGAT GTCCGCCAGC GGGCTAGCCC AATGGGGCCC ACGCGCCACC 
ACCGACTTCC TCGGAACCCG GCCATCACCA CGGCTGCTCC ACACCATCTT CACAGCGCTG 
CGCGGCGACA ACGAGATCGA CCTCGCCCGC ATCAAAGGCC TGAAGAAAGC GATGAGCCGA 
TGA

Protein sequence

MVPEPVTRRP SATADLATRQ STGVRPSLPI AAGGLGSGHP GRAKSPVVKV VDLAFLEFER 
PDLDRSEAFA RDFGFAVAQR TPDTLMLRGI LSGGPCMMIR RSTAARFVGP AFAAADATDL 
NRLAQATDAT VRDLATAVPA FGGGILDGAT AVELRDPTGL PVRVVHGIPE LPALDEQHPL 
VLNVGSQTPR VNLTQRPPRE PARVQRLGHL VLESPVFGRA LDWYLQTLGL IVSDFLFLDG 
QRDRGPTMAF IRCDQGRRPV DHHTLAMLLG PSGGYVHSAY QVSDLDALAA GGEYLRERGW 
RRSWGIGRHI QGSQIFDYWR DPDGFLVEHF TDGDLFDAST EPTWTPMSAS GLAQWGPRAT 
TDFLGTRPSP RLLHTIFTAL RGDNEIDLAR IKGLKKAMSR