Gene Franean1_2815 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2815
Symbol
ID	5671204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3331236
End bp	3333365
Gene Length	2130 bp
Protein Length	709 aa
Translation table	11
GC content	72%
IMG OID	641241724
Product	phage integrase family protein
Protein accession	YP_001507144
Protein GI	158314636
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.952182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCG CGGCGCACCC GCAGGCGCAC CCCCAGGATG CCGTCGGCTG GCCGGACGAC 
GACACGATCG TGCTGGCCGG CCGGCCAGTG CGCCCCAGCA CCGACGAGAC GCTGCTGTCC 
CGGTTCGGTG ACCTGGTCTG GCAGCTGAGC CCGGCACATC CCGACGCCCA CATCACCGTC 
GCCGCGCTGG ACTGGCGGCG CTACCCGCCC CAGCTCGTCC GGCCGTTCAA GACGTTCTTC 
CACACCGCAC TGGAGCAGCC CTACCCGGCG TCGCCGAACG TGCAGCGGCC CGGCGAGCGG 
CCCAGCGTCG CCACGCTCAG CTACTGGTTC GTCGACCTGC TCGTCTTCGC CACCTGGCTC 
GACGAACGCG CCGTCGGCCA CCTCAGCGAC ATCACCACCG CCGACCTAGA CGCCTACCGG 
TCCCACGTCC TCGGGCTGGG CCGAAGCCCC GCCCGCGAGA CGGACCTCCT CGCCGCCGTC 
CGCACCCTGT GGATCTACCG TGACCGTCTT CCGGCGGCGT GCCGGCTTCG GGTCTGCCCG 
TGGGGCGGCC TGGCGGCCAA GGACCTGGTC CGCCTCCCAC CCGCCGGCCG GGAGAACGCC 
ACCCCCCGGA TCGCCTCCGC GACGATGGAC GCCCTGCTCG CCTGGGCGCT ACGCATGGTC 
GAAACCCTCG GCCCGGACAT CCGCGACGCC TGGCACGAGT TCCACGACCT CGACGCGGGC 
AACCACCCCT CCCAGCAGAT CTACCAGGGG ATGGGCATCC CCGACCGCCT GCACCTGTTC 
CTCCACCACG CCAGCAGACG CGGAACCTTG CTGCCCGGAC GGCACGACCC CGCCCGCGGC 
ACCGCCGTCA ACGGCAGTCA CATCCTGCGC CTGGTCGGGG TCCCCCCGGA CAAGCGCGCC 
GGGCTGCCCT CACGGCAGCG GGCGCTGCTG GAGAACGCGG GCGTACCGAT CAGCACCGAC 
ACCACCGTCG GCAGGATCAC CGCACGCCTC GACGGCATCC CCTGGCGGCC CGGCCCGATC 
AGCATCCGCG AGCTCCCCAC CCTGGTGCGG CTGCTCTATG CTTCCGCCTT CACCGTCATC 
TGCTATCTAT CGGGCATGCG CCCCGGCGAG GTCCTCACCC TGCCCCACGG CTGCGCCGGC 
AGCGACCCCC GCACCGACGA GCTGCTGCTG CACGGCCGGC GGGGCAAGGG CTACGACCGA 
AGCCCCCTGA CCCCCGGGCA GGTCGAACCC GACCGACCCT GGGTAGTCGT CGCCCCGGTC 
CACACCGCCG TGCGGATGCT GGAAAGCCTC GCCGACTTCC CGTTCCTGTT CCCCGCCAGC 
CCGATCGCCG CCCACGCCGG CCGGGCCAAC ACCACCCACG CCCGCTCCAC CGCCGCGATC 
AACCAGGACC TGGAAGACCT CGTCACCTGG GTCAACACGA CCTTCACCCG CCCGGACGGC 
ACCCCGCCCA TTCCACCCGA CCCGACCAAG CACCTCCACG CCACCCGCTT CCGGCGCACC 
CTCGCCCACA GCATCGTCCG CCGTCCCCGC GGCCTCATCG CCGCCGCCCT GCAATACGGA 
CACGTCCGCG CCAAGGTCAC CCTGAGCTAC GCGGGCGCCG CGGACACCTC CTGGCTCGAT 
GACCTGGCGG TCGAGCGCCT GGAGATGGTC ATGGAACAGA CGCAGACCGA TGCCCGGCTC 
CTCGCCGACG GCGAGCACGT CAGCGGACCC GCCGCCACCG ACTACCGCAC CCGGATCGCT 
CGGTTCCACG GCCGAGTCGT CAACCAGCCC CACAACGCCC GACGGCTCCT CGCCAGCACG 
GACCCAGACA TCCACCACGG CGACGGCCTC ACCTGCGTCT ACCGCGCCGA GACCGCCGAA 
TGCCGCCGCA TCCTCGCCCG ACAGGGGATC ACCGTCGACG GGCCGCAAGA GTCCCACTGC 
CGGTCGACCT GCCGCAACCT CGCCTACACC GACCGCAGCA TTGACCAGCT GCGCTCCCGG 
CTCGATCTCC TGGTCGCCAC CACCGGCGAC TCCCTGACGC CCCAGCCGCT CCGCGACCGA 
GCGCACGCAC AGGCCCAGGC CGCCAGAGCC ACCATCGACC GGCACGTCTC ATCCTCCCCA 
CATCGGGCAG ACCAGGCAGG CCAGCGATGA

Protein sequence

MTTAAHPQAH PQDAVGWPDD DTIVLAGRPV RPSTDETLLS RFGDLVWQLS PAHPDAHITV 
AALDWRRYPP QLVRPFKTFF HTALEQPYPA SPNVQRPGER PSVATLSYWF VDLLVFATWL 
DERAVGHLSD ITTADLDAYR SHVLGLGRSP ARETDLLAAV RTLWIYRDRL PAACRLRVCP 
WGGLAAKDLV RLPPAGRENA TPRIASATMD ALLAWALRMV ETLGPDIRDA WHEFHDLDAG 
NHPSQQIYQG MGIPDRLHLF LHHASRRGTL LPGRHDPARG TAVNGSHILR LVGVPPDKRA 
GLPSRQRALL ENAGVPISTD TTVGRITARL DGIPWRPGPI SIRELPTLVR LLYASAFTVI 
CYLSGMRPGE VLTLPHGCAG SDPRTDELLL HGRRGKGYDR SPLTPGQVEP DRPWVVVAPV 
HTAVRMLESL ADFPFLFPAS PIAAHAGRAN TTHARSTAAI NQDLEDLVTW VNTTFTRPDG 
TPPIPPDPTK HLHATRFRRT LAHSIVRRPR GLIAAALQYG HVRAKVTLSY AGAADTSWLD 
DLAVERLEMV MEQTQTDARL LADGEHVSGP AATDYRTRIA RFHGRVVNQP HNARRLLAST 
DPDIHHGDGL TCVYRAETAE CRRILARQGI TVDGPQESHC RSTCRNLAYT DRSIDQLRSR 
LDLLVATTGD SLTPQPLRDR AHAQAQAARA TIDRHVSSSP HRADQAGQR