Gene Franean1_5518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5518
Symbol
ID	5675765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6686578
End bp	6688011
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	70%
IMG OID	641244374
Product	integrase family protein
Protein accession	YP_001509778
Protein GI	158317270
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0834932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACGA ACAGCGACAA CCACCCGACC ATGAGCCTGC AACAGGCACT CCGAGAGCAC 
CTCGACCGTG CCCGCGCCGG ACAGGGCCTG CTCTACCCAC AGCCCGAAGG AGAGACCAAG 
TTCGCCTGCG ACATGGGCGA CAGCCGCTAC GGCTGCGCCT GGTGCGACAA CATCGAATGG 
CCCGACGGCA ACCCCCCTGG ACGGCGAGTG ATGGCTGCGG GGGACGGTGC CGGGAACGAC 
CGGCGGAAGC GGCGGCGCTC CCAGGGCGAA GGCGCCCTGT TCCAGCGGGC GAGCGACGGC 
CTGTGGGTCG GCCGCGCCGA TCTCGGCTGG GTGGACGGGA AGCGTTCCCG CAAGACGGTC 
TACGGCAAGA CCGAGAAGGA ATGCCGGGAG AAGCTCACCA AGGTCCAGCG CGCGGCCGAA 
CTCGGCGTCA ACGTCACGGC TGAGCGCCGG ACGGTCGCGG TCTGGCTGGG GGAGTGGCTC 
GACATCAAGG AGGGCGACGG CACCCGCGCG TCGACGCTCC GGGCGTACCG CTGGTTGATC 
AACATGCACA TCGTGCCGGT GATCGGCCGT GTCCAGCTCG ACAAGCTGAC TCCGTTGGAC 
GTCCGGCGGC TCGTCGCCTC GGCGAAGAAG TCGGGGCTGT CGGCGGGCAG CGTCCGCCAC 
GTGCACAGCT TGATCCGCAA CGCTCTGGCG GAAGCCGAGC GGCTGGACCT GGTGGCGCGC 
AACGTGGCGA AGGCGGTCAA GGCGCCACCC ACCCCGCATC GGGAGGTTCG GGCGCTGCGG 
CCGGAAGAGG CGCGCCGGCT CGTCGAGGTG CTCCGTGGTG AGCGGCTCGA AGCGGTGTTC 
GCGTGTGGGC TGATGCTCGG GCTACGCCGC GGGGAGATCC TCGGCCTGCG CTGGTCTGAT 
GTCGACCTGG ACGGCGCGAC GCTCCACGTT CGCCAGACCC TGCAACGGGT CGACGGCTCG 
CTGATGTTCG TCCCGGCGAA GACGGAGCGG TCCCACCGGC GGCTGCCCAT CCCGCCGAAG 
CTGGTGACGA TCCTGCGGCG GCACCGGGCC ACCCAGACAG CGGAACGAAC CGGCCTCGGT 
GACGCCTGGA CGGAAACCGG GCTGGTGTTC ACCTCGTCCA TCGGCACGCC GTTGGAACCA 
AGGAACGTCA ACCGGCGGTT CGATGTGCTG CGCCGTCAGG CCGGGCTGCC GTGGCTACGG 
CTGCATGATC TGCGCCACGC CTTCGCGTCG ATGCTCTTCG CTGAGGGTGT GCCGGCCCGG 
ACGGTGATGG AGCTGCTCGG GCACTCCACG ATCCAGCTCA CCATGAACAC CTACACGCAC 
GTGATGCCGG AGACCCAGCG CGACGCGGTC GGCCGGCTCG ACCGGATCTT CAACGACGAT 
GCCGGCGATG TCGCCGACGT CGACGGAGCG GACGGGGAGG GCCTCGCGGG CTGA

Protein sequence

MPTNSDNHPT MSLQQALREH LDRARAGQGL LYPQPEGETK FACDMGDSRY GCAWCDNIEW 
PDGNPPGRRV MAAGDGAGND RRKRRRSQGE GALFQRASDG LWVGRADLGW VDGKRSRKTV 
YGKTEKECRE KLTKVQRAAE LGVNVTAERR TVAVWLGEWL DIKEGDGTRA STLRAYRWLI 
NMHIVPVIGR VQLDKLTPLD VRRLVASAKK SGLSAGSVRH VHSLIRNALA EAERLDLVAR 
NVAKAVKAPP TPHREVRALR PEEARRLVEV LRGERLEAVF ACGLMLGLRR GEILGLRWSD 
VDLDGATLHV RQTLQRVDGS LMFVPAKTER SHRRLPIPPK LVTILRRHRA TQTAERTGLG 
DAWTETGLVF TSSIGTPLEP RNVNRRFDVL RRQAGLPWLR LHDLRHAFAS MLFAEGVPAR 
TVMELLGHST IQLTMNTYTH VMPETQRDAV GRLDRIFNDD AGDVADVDGA DGEGLAG