Gene Franean1_4698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4698
Symbol
ID	5673040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5612661
End bp	5613662
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	73%
IMG OID	641243555
Product	sucraseferredoxin family protein
Protein accession	YP_001508971
Protein GI	158316463
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4759] Uncharacterized protein conserved in bacteria containing thioredoxin-like domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCTCC GTACCACGTC CCCGGCACTG TCCTACCGTT GCGCGCCCTG GACGCACGCG 
CAGGGCGTCG ACCCGGTCGG GTCCGCCCTG ACCTGCGACA CGCTCGTGCT CATCGAGGTG 
CCACCGCCCT GGCCCCGGGA CGTCGGCGAG ATACCGGCCT TCGCCGACCT CCAGCGGCGT 
GACCTTCGCC GAACCAGGGT GCTGGCGGTC AGACCCCCTG CGGACGATTT CAACGACCCG 
ATCGGGAAGG CCGCCGTCCC GGTGGGCTCC GCGGTCGCCA GCGATCAGCC GGGACCAAGC 
GTCGGGTGCG GTGTGCGGGT GACGATCTGG CGCCGGGTGG ACTCCGGCCG TTTCGTGGGT 
ACCGACCACC TCGTGCCCGC CGAAGGCATC GCCGACGAGG TCGCCCGGCT GCTCGAGGCG 
CCGCAGGCGG ACCCGACGAG CCGGACCGCA CCCGCCGAGG TGCTGCTGTG TGGGCACGGC 
GCGCGGGACC GCTGCTGCGC GCGCCTGGGG ACTCGCCTGG CACTGGACGT GGCCGCGGCC 
TGGCCAGGTG TCCGCGTCCG CCGGTGCAGC CACACCGGCG GTCACCGCTT CGCTCCGACC 
GGGTTCACGC TGCCGGACGG GCGGGCCTGG GGGTTCCTCG ACGTCGAGAG CCTCGAGGTG 
ATCATGCGTC GATCCGGGCC GCCGCCGCTG CGGGGCCACT ACCGCGGTAA CACCGCGCTG 
GACGCCTGGG GACAGGTGGC CGAACGGGAG CTGTTCGAGC GGTTCGGCTG GGCCTGGCTG 
GACCACCAGC TCACCTCCTC TCGCACCGAG ATCGCGGCCG GGGGACGGTC GGCAACCGTG 
GAGCTGGCCT GGGGCGGACC GACCGGTCCC GCTACGGCGA CTGCGAGGAT CGACGTCATC 
CGCGACGTTC CCGTCCTCGT CTGCGGCGAG CCTCCCGAGC GGGCCGAGAA GACGGCACCG 
GAACTGGCAC TACGCTCCAT CAACCTCGCC GGCAGAGGCT GA

Protein sequence

MSLRTTSPAL SYRCAPWTHA QGVDPVGSAL TCDTLVLIEV PPPWPRDVGE IPAFADLQRR 
DLRRTRVLAV RPPADDFNDP IGKAAVPVGS AVASDQPGPS VGCGVRVTIW RRVDSGRFVG 
TDHLVPAEGI ADEVARLLEA PQADPTSRTA PAEVLLCGHG ARDRCCARLG TRLALDVAAA 
WPGVRVRRCS HTGGHRFAPT GFTLPDGRAW GFLDVESLEV IMRRSGPPPL RGHYRGNTAL 
DAWGQVAERE LFERFGWAWL DHQLTSSRTE IAAGGRSATV ELAWGGPTGP ATATARIDVI 
RDVPVLVCGE PPERAEKTAP ELALRSINLA GRG