Gene Franean1_4673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4673
Symbol
ID	5673015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5581632
End bp	5582798
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	70%
IMG OID	641243530
Product	L-rhamnose isomerase
Protein accession	YP_001508946
Protein GI	158316438
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4952] Predicted sugar isomerase
TIGRFAM ID	[TIGR02635] L-rhamnose isomerase, Streptomyces subtype

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.239648
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.828695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCAT TCAGCCAGAC GACAGAGGAC CTCGCTCGGC AGGAGATCGA GCTGCCCTCG 
TGGGCGTTCG GGAACTCCGG GACGCGCTTC AAGGTGTTCA CGCAGCGTGG CATCCCGCGT 
GATCCGTTCG AGAAGGTCGC CGACGCGGCG CAGGTGCACC GGTTGACCGG GCTCGCGCCG 
TCGGTCGCGC TGCACATCCC CTGGGACGTC GTCGACGACT TCGACAAGCT GGGCGAACAC 
GCGCGGGCCA ACGGCGTCCG GCTCGGGACG ATCAACACGA ACACGTTCCA GGACGACGAC 
TACCTGCTCG GCAGCCTCTG TCACGTCGAC GAGCGCGTCC GGGCGAAGGC GGTCAGGCAC 
GCCCTCGACT GCGTCGACAT CATGGACGCG ACGGGCAGCC GCGACCTGAA GATCTGGCTG 
CCCGACGGGC TGAACTACCC CGGCCAGGCC GACCTGCGCG ACCGGCAGGA GCGGCTCGCC 
GACGCCCTGG GCCAGATCTA CGCCCGGCTG GCGGCGCACC AGCGGCTCGT GCTCGAGTAC 
AAGCTGTTCG AGCCGGCCTT CTACGCCACC GACGTCCCCG ACTGGGGCAC GGCCTACGTC 
CACTGCCTCG CGCTCGGGGA ACGTGCCGTG GTGTGTCTGG ACACCGGCCA CCACGCCCCG 
CACACCAACA TCGAGTTCAT CGTGATGCAG CTGCTCCGGC TGGGGCGGCT GGGGGCGTTC 
GACTTCAACT CCCGCTTCTA CGCCGACGAC GACCTGATCG TCGGCGCCGC TGACCCCTTC 
CAGCTGTTCC GGATCATGAC CGAGGTCGTC CGGGGCGGTG GCTACGACGA GGGCAGCGAG 
GTGACCTTCA TGCTCGACCA GTGCCACAAC ATCGAGGCGA AGATCCCGGG CCAGATCCGG 
TCCGTGCTCA ACGTGCAGGA GATGACGGCC CGCGCGCTGC TCGTCGACCG GGCGGCGCTC 
GCCGAGGCTG AGCGCGCCGG GGACGTGCTG GCCGCGAACG CGGTCCTCAT GGACGCCTTC 
TACACCGACG TGCGCGCAGA CCTCGCCGCC TGGCGTGAGT CGCGCGGGCT GCCCGCCGAC 
CCCCTGGCGG CCTTCCAGTC CAGCGGTTAC GCCGAGCGCG TCGCGGCCGA GCGGGTCGGT 
GGCACCCAGG CCGGGTGGGG CGCGTGA

Protein sequence

MRAFSQTTED LARQEIELPS WAFGNSGTRF KVFTQRGIPR DPFEKVADAA QVHRLTGLAP 
SVALHIPWDV VDDFDKLGEH ARANGVRLGT INTNTFQDDD YLLGSLCHVD ERVRAKAVRH 
ALDCVDIMDA TGSRDLKIWL PDGLNYPGQA DLRDRQERLA DALGQIYARL AAHQRLVLEY 
KLFEPAFYAT DVPDWGTAYV HCLALGERAV VCLDTGHHAP HTNIEFIVMQ LLRLGRLGAF 
DFNSRFYADD DLIVGAADPF QLFRIMTEVV RGGGYDEGSE VTFMLDQCHN IEAKIPGQIR 
SVLNVQEMTA RALLVDRAAL AEAERAGDVL AANAVLMDAF YTDVRADLAA WRESRGLPAD 
PLAAFQSSGY AERVAAERVG GTQAGWGA