Gene Franean1_1834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1834
Symbol
ID	5670236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2200565
End bp	2202724
Gene Length	2160 bp
Protein Length	719 aa
Translation table	11
GC content	77%
IMG OID	641240755
Product	hypothetical protein
Protein accession	YP_001506178
Protein GI	158313670
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.610374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.1985
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGCAG GGCGCGGACC GCGCTGGCGC GGCGGGCGGG CCGGCCGCGC CGCCGAGGTG 
CTCGACGGCC GGCGTGAGCC CCTCGACGAG ACCGAGCTGC AACTGGCGCG CGCGGTCGCG 
ACCCTGCGGG TGCTGCCCGG GGCACTGCCC GCGCCGGCGA TGTCCCCCCG GGTCCGCGCC 
GAGATCCGGG CGATGCTCCT CGCCGAGCCG ATCGGCGCCC GCGGCACCCA CGAGGTTGGT 
GAGGGCAACG GCAGGGAAAC CGTCGGCGCG GCTGAGAGCA CCCGGCGGGC ACAGCCGACC 
CGACCGGCCC GGCCCGCCGC GCTCGTCACC CGGCCAGGCG GGATGGGCGT CCGGCAGGCG 
TTGCGTGCCG CCCGGCCGGC CCTGATCGGG GCGCTGGCCG TCTCGGTCGC GACGGTGGGC 
GTCGCCGTGA GCGCCGAGCA GGCCCTGCCC GGTGAGCTGC TCTACGGAGT GAAGCGGCAG 
GTCGAGCAGA TTCAGGTCAG CCTGGCCGGC AACCGCGTCG ATCGCGCCAA GATCCAGCTC 
TCCGTCGCCC GGAACCGGAT GGACGAGCTC GCCGCGGTCG TCCATCCGGC AGCCCGGCCA 
CCGGCCAGCA CGCGCACCGA CTCCCCCACC ACCGGCGGAA CCACGGCTGG CCTCGGCCCA 
ACTGACAGCG ACCCAACTGA CAGCGGCCCG ACTGGCGGCG GTGCCGCCGG ATCGCCCTCG 
GGCCAGCCAC TTCCAGCAAC GACCCCGGGC CCCGGATCTG CCGGGGCGCC GCCGACAGAG 
GCGGCGCCAG AGCAGACGGG CGACCCGGTC GCAGGCGGCC TGGTGCGAAC GGGCGGATCG 
GTGCCGGCGG GCGCCGCGAC CCCCGATCCG GCCGCTTCCT CCCCGAGCCA CGCGGCGCCC 
GGGGGGCGTC CGGCCACGGA CGGGGACATC GGCACGGTGA CCAGGCTGCT GCGCGACTGG 
TGCGACGAGG CCGGGGCGGG GAGCGCGGTC CTGATCGAGG AGGCGCTCGC GGGCAGCCGC 
GACGCCCGGG CGACCCTGAA CGAGTTCGCC GCGGACCAGT CGACGCGCCT CGAGGCGCTG 
TTCGACGCGC TACCGACCGG CTCGGTGCCC GGCGCGCACA AGGCTCGGCG GATCATCCAC 
GACGTCGACT CGGCGCTGGC CGTCACCGCC CCGGAGGCCG ACGGGCCGTC CGGGGCCGGC 
ACCGCGGCGG GGCGCGGCGG CACGACGGCC GGGACGGCGA GCGGCGGCAC CTCACCTGAC 
CCGACCGGCC GGGCACGTTC GGCCGACGGG ATGACCAGCC CGACGGTCAC TGAGCGCGGC 
GACTTCCAGC GACAGTCCAC CGGGCCGCGG GCTACGGCGC CCGTGCCGAC CGTCTCCGCG 
GCGATCGGCG GCATGGCCGG CGGGTTCCTC CCCGGCCTGC CCTTCCTCAC ACCGTCACAG 
TCACTGACAC CTGACCAGCC ATCGGCGTCC GGCAAGCCGT CAGCGCCTGG CCAGCCAGCG 
GCATCTGGGC AGGCGTCGAC GCCCACGCCC GCATCGCCGC CGCCCGGCAC GGTTCCCGGA 
GATCCGGGCG CCCCGCCGGC GGACCGGTCG GCACCCGATC TCCCGCTTGT TCTGGAACCA 
GAGCCGTCGG CACCGCCGCC GACGGGCGGG CATCCCGGCG GCGGCACGTC GGCACAGTCC 
TCCCCCACGA CGCCGCCGGA CGTCCTCGAG ACGTTCGACG CGCCCGCGAA GGCGGTCGGC 
CCCGCCGATG ACCCCGCCGA TGACCCCGCG GTCGACGATC CCGCGGTCGA CGATCCCGCC 
GGTGGCGGGG CCGAGCAGAC TCCGGCGGAC GGTTCGTGGT CGGACGGTCC GCGGCCCGAG 
GTGTCCCCCG TCGCTCAGCC GTCACCGGCG GCGTCGGACG ACCCGCTGGC GGAGAAGGCC 
GTCTTCGGGG AGTGGGCGGC CGAAACCGCC CCGGACAGCG CGGAACCGCC CAGCCCCGAG 
ACAGCCCCGA GCGGAAAGAC GGCCCCGACC GCCGGGACGA CGCCGACCAG CGCGACGACA 
CCGACCGGCG AGGCAGAGCC GACCGGCGAA GCGGAGCCGA CCGGCGGAAC CGCGGTCACC 
CCGACGACCG AGGCCACCGA GGACGTCACC GGAGGGAACG CGCCGGCCGG GCAGCCCTGA

Protein sequence

MAAGRGPRWR GGRAGRAAEV LDGRREPLDE TELQLARAVA TLRVLPGALP APAMSPRVRA 
EIRAMLLAEP IGARGTHEVG EGNGRETVGA AESTRRAQPT RPARPAALVT RPGGMGVRQA 
LRAARPALIG ALAVSVATVG VAVSAEQALP GELLYGVKRQ VEQIQVSLAG NRVDRAKIQL 
SVARNRMDEL AAVVHPAARP PASTRTDSPT TGGTTAGLGP TDSDPTDSGP TGGGAAGSPS 
GQPLPATTPG PGSAGAPPTE AAPEQTGDPV AGGLVRTGGS VPAGAATPDP AASSPSHAAP 
GGRPATDGDI GTVTRLLRDW CDEAGAGSAV LIEEALAGSR DARATLNEFA ADQSTRLEAL 
FDALPTGSVP GAHKARRIIH DVDSALAVTA PEADGPSGAG TAAGRGGTTA GTASGGTSPD 
PTGRARSADG MTSPTVTERG DFQRQSTGPR ATAPVPTVSA AIGGMAGGFL PGLPFLTPSQ 
SLTPDQPSAS GKPSAPGQPA ASGQASTPTP ASPPPGTVPG DPGAPPADRS APDLPLVLEP 
EPSAPPPTGG HPGGGTSAQS SPTTPPDVLE TFDAPAKAVG PADDPADDPA VDDPAVDDPA 
GGGAEQTPAD GSWSDGPRPE VSPVAQPSPA ASDDPLAEKA VFGEWAAETA PDSAEPPSPE 
TAPSGKTAPT AGTTPTSATT PTGEAEPTGE AEPTGGTAVT PTTEATEDVT GGNAPAGQP