Gene Franean1_6777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6777
Symbol
ID	5675090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8248683
End bp	8250653
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	72%
IMG OID	641245626
Product	resolvase domain-containing protein
Protein accession	YP_001511017
Protein GI	158318509
COG category	[L] Replication, recombination and repair
COG ID	[COG1961] Site-specific recombinases, DNA invertase Pin homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGGGC TGGTCGCGGG TAGCCCGGGC AAGGTGCAGG GCTGGCACCG TGACCGCCTT 
GCGGTGGTGT ACGTGCGTCA GTCCTCCCGG CAGCAGGTCG CCGATCATGG GGAGTCCACG 
CGGCTGCAGT ACGGGTTGGT GGAGCGGGCG GTGGCGCTGG GCTGGCCGCG GGTCCGGGTG 
CGGGTGATCG ATGAGGATCT GGGGCGCTCG GCGGCGGGTG CGCAGGACCG GCCGGGTTTC 
CGGCGTCTGG TCACCGAGAT CTCGATGGGC CGGGTGGGGC TGGTGCTGGG GTTGGAGATG 
TCCCGGCTGG CCCGGGCGGG CCGGGACTGG CATCAGCTGG TCGAGCTGTG TGGGCTGTCG 
GGGACCCTGC TGGGGGACAC CGACGGGGTT TACGATCCGG AGGAGTACAA CGACCGGCTG 
TTGCTGGGTC TGAAGGGGAC CATGAGCGAG GCCGAACTCC ATCTGATCAA GCAGCGGATG 
GCGTCGGGGC GACTGGCCAA GGCCGCCCGG GGAGAGCTGG CGGTTCCGCT GCCGACCGGG 
TATGTCCGCA GGCCCTCCGG TGAGGTGGCG TTCGACCCCG ACGAGCAGGT CCAGGCCGTC 
GTCCGGCTGG TGTTCTCGCT GTTCGCCGAG CTGGGCACGG TGCATGCGGT GCTGCGTTTC 
CTGACCGAGC ACCAGATCCA GATCGGGATA CGGGAACGGG CAGGGCCGGC CAAGGGCGAG 
GTGGCCTGGC GTCACGCGCA CCAGACCGGG CTGGTCAACA TGCTGCGCAA CCCGGCCTAT 
GCCGGGATCT ACGCCTATGG GCGCAGCCGC GTCGCGGTGC GCGGCGGGCC GCCGCGCGGC 
GGCCGGGTCC ACACCGGCCC CGAAGGGTGG CTGGTGACGA TCCCGGGGCT GTTGCCCGCT 
TATATCAGTG TCGAGCAGTA CCAGGCCAAC CTGGCCCGGA TGGCGGCCAA CCGGGCCCGG 
GCGGAAAGCC TCGGCGCTGT CCGGGACGGC CCCGCGCTGC TGACCGGCCT GGTGGTCTGC 
GGAGTCTGCC GCCGGCGGAT GGGCGTGGCC TACGAGGCCA GCCGCACCGG TGTGGTGCAC 
CGCTACGTCT GCCAGCGCAA CCATCTGACC TACGGGGTGG GGCGCTGCCA GCAGATGGCC 
GGCGCTTTCC TGGATGCCCA TGTGGTCGCC CAGGTGCTGG CCGCGCTGAC CCCGGCCGGG 
CTGGAGCTGT CGGTGCAGGC CGCCGAGTGC GTCGAGCGGC GCCGGCAGGA GGTGGACCAC 
ATCTGGCGGC AGCGGCTGGA ACGCGCCGAG CAGGCCTGCG TGCGGGCGCG GCGTCAGTAC 
CAGCTCGCCG AGCCGGCGGG GAGGAATCGT TCCCCCAGCA TCCGTCCCGC CGCCCGCAAC 
GCCCCATCCA ACGGATCCGC GGCGACGCCA CCGGCACCCG GCGCTTTCAG GACCAGCCCG 
CCGGTGGACC TGCGGGCCCG GACCCGGTCC AGTTCGTGCA GCACCTGGCC AGCGGACCAG 
TCCACCCCGG CCGGCCGGCC CTCCACCGTG CCTTCGGTGG TGCTCAGGGC CGCCCGGTTC 
GGGGAGATGC TCAAAGTTGC GGCGCGGGGG CCTTCGGCCC GGTACGCCAG ACCCGGTGGA 
GGGCGCACAG TCCCGTCCGC GGCCGGCCGG GACCGCCGCT GGCCCTGCAA GGAGGCGACC 
AGTTCCCCGA CCCGGGCCGT GTATGTGGCC GGATCATGGG TGTCGCGGAA ATCCACCCAC 
ACCCGCGACG CCAGAAACGC CGGCAGGTCA GCGTCTTTGA GGAGGACGGG GATTGTGAGG 
CGTTGCTGGC CGGCGACCGC GCGGGTCAGC ATCGCCGCGT ACTCCTCACC CACCCACGGC 
CGCGACAGCG CCTGCGGGCT GACGACCAGG ATCCCCGACG CCGAACCCAG GATGCCCGCG 
TCGAGGCGGT GGGCGAGTAC ATCCCCGGCG TCGATCTCCC ACTCGTCGTA G

Protein sequence

MLGLVAGSPG KVQGWHRDRL AVVYVRQSSR QQVADHGEST RLQYGLVERA VALGWPRVRV 
RVIDEDLGRS AAGAQDRPGF RRLVTEISMG RVGLVLGLEM SRLARAGRDW HQLVELCGLS 
GTLLGDTDGV YDPEEYNDRL LLGLKGTMSE AELHLIKQRM ASGRLAKAAR GELAVPLPTG 
YVRRPSGEVA FDPDEQVQAV VRLVFSLFAE LGTVHAVLRF LTEHQIQIGI RERAGPAKGE 
VAWRHAHQTG LVNMLRNPAY AGIYAYGRSR VAVRGGPPRG GRVHTGPEGW LVTIPGLLPA 
YISVEQYQAN LARMAANRAR AESLGAVRDG PALLTGLVVC GVCRRRMGVA YEASRTGVVH 
RYVCQRNHLT YGVGRCQQMA GAFLDAHVVA QVLAALTPAG LELSVQAAEC VERRRQEVDH 
IWRQRLERAE QACVRARRQY QLAEPAGRNR SPSIRPAARN APSNGSAATP PAPGAFRTSP 
PVDLRARTRS SSCSTWPADQ STPAGRPSTV PSVVLRAARF GEMLKVAARG PSARYARPGG 
GRTVPSAAGR DRRWPCKEAT SSPTRAVYVA GSWVSRKSTH TRDARNAGRS ASLRRTGIVR 
RCWPATARVS IAAYSSPTHG RDSACGLTTR IPDAEPRMPA SRRWASTSPA SISHSS