Gene Franean1_0125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0125
Symbol
ID	5668550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	149587
End bp	150732
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	73%
IMG OID	641239053
Product	rhomboid family protein
Protein accession	YP_001504498
Protein GI	158311990
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGACT CGCCAGCGGG TGATCCGGCC CGTGCGCCGG AAGGCTCTTC TGGTGCGCCC 
GGGGGTTCCG GTGGGGCCGG TAGTGCCGGC GAAGCCGAGA TCCCGCGTCC CGCGTCCCCC 
CTGCCCGCCG CAGGCGAGCC GCCGCCCGCC GGCGGCCCTC CCAACGGCGG CCCTCCCAAC 
GGCGGCCCTG CGTCGGGCGG CCCGCCGCAC GAGCAGGTCG GATGGCGGCC GGAGACCGGC 
CCGCCCGCCG GCCACGCCGG GTGGACCCCA CCGCCGGCGG GAGCGCCGAG CCTGCCCCAC 
TGCTATCGGC ATCCCGAGCG GGAGACGTAC GTCACCTGCC AGCGGTGCGG GCGTCCCATC 
TGCCCGGACT GCATGCGCCC GGCGGCTGTG GGCTTCCACT GCCCGGAGGA GTCCGGCGCC 
GGCGGTGGCG GGCGCCCCGA GCGGCGCCGA GAGCCGCGGA CGGACTTCGG TGGCCGGCCG 
GGAGCCGGTC GCCGCGGGCT GGTCACCCAG GTTCTGATCA GCCTGTGCCT CGTCGCGTTC 
GTCCTGCAGG GCCTGCCCGG GCTGGCGCGC GACTCCGGCT CCCTGAACCA GTTCAGCGCC 
GACTTCCGCC TGTACGGCGT GTCTCTCGCG TGGGACGACC AGTACTACCG GCTCCTCACC 
GCCGCCTTCC TGCACGTCAA CTACCTGCAC GTCCTGGTGA ACCTGTACGC GTTGTTCGTG 
CTCGGCTACC AGCTCGAGGC GATTCTCGGG CGGCTTCGCC TGGTAGCCCT GTTCGTCGCC 
TGCGCCGTCG GTGGGAACAC CCTGAGCTAC CTGGTGAACG GTGTGTCCGT GAACTCGGTC 
GGGGCGTCCA CCGCGATCTT CGGTTTTTTC GGCGCGTACT ACGTGATCGC CCGGCGGCTG 
CGCGCCGACA CGACGCAGAT CCTGATCCTG ATCGGGATCA ACTTCGCGCT CACGTTCACG 
CTGTCCTTCA TCGACCGCTG GGGCCACGTC GGGGGGCTGG TGGCCGGGGT GCTCGTCGGC 
CTGCTCTACG CCTACGTCCC GCCGCGCCGA ACGGTCGTGC AGGCGGCCGG GGTGCTGGCG 
CTTGTCGGCC TGCTCTTCGC GGCGGCCGTC ATCAAGAGCG CGGACCTGAC CACCGCCTTC 
GCCTAG

Protein sequence

MTDSPAGDPA RAPEGSSGAP GGSGGAGSAG EAEIPRPASP LPAAGEPPPA GGPPNGGPPN 
GGPASGGPPH EQVGWRPETG PPAGHAGWTP PPAGAPSLPH CYRHPERETY VTCQRCGRPI 
CPDCMRPAAV GFHCPEESGA GGGGRPERRR EPRTDFGGRP GAGRRGLVTQ VLISLCLVAF 
VLQGLPGLAR DSGSLNQFSA DFRLYGVSLA WDDQYYRLLT AAFLHVNYLH VLVNLYALFV 
LGYQLEAILG RLRLVALFVA CAVGGNTLSY LVNGVSVNSV GASTAIFGFF GAYYVIARRL 
RADTTQILIL IGINFALTFT LSFIDRWGHV GGLVAGVLVG LLYAYVPPRR TVVQAAGVLA 
LVGLLFAAAV IKSADLTTAF A