Gene Franean1_6731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6731
Symbol
ID	5675044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8186498
End bp	8187424
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	69%
IMG OID	641245580
Product	NLP/P60 protein
Protein accession	YP_001510971
Protein GI	158318463
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins) [COG2951] Membrane-bound lytic murein transglycosylase B
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00865661
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.270738
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGGC TCGTCCTCGG ACTGTGCGCG CTGCTGCTCG CCGTACCGAT CCTCGCCGGC 
GGCGTCGCGG CCGGACTCCT CGGCGGCGAG GCCGGCGGCG GCGAGCCGGC ATCCGCCGCG 
GCCGCCGCGG GGGAGATCCC TGTCGACTAC CAGCGGCTCT ACGTCACCGC TGCGGCCACC 
TGCCCGGGGC TGCCGTGGAC GGTGCTGGCC GCGGTCGGGA AAGTCGAGAC CGACCACGGG 
CAGAACCCGG ACTGGACCTC GCTGGCCGGC GCCCAGGGGC CGATGCAGTT TCTGCCTACC 
ACCTTCGCCG CCTATGGGGT CGACGGCGAC GCCGACGGCA GCACCGACAT CAACAATCCC 
GCCGACGCTG TCTACTCCGC CGCCCATTAT CTGTGTGCCT CCGGCGCACA GAACGGCGCG 
AATATTCCCG GGGCGCTCTA CACCTATAAT CATGATAATT CTTACGTGAC GCGGGTTCTC 
ACCCAGGCCG ACGTTTACAC CACCTCCGAC CTCACCACCA GCAGCGGCCC GTCGGACGCG 
GCGCTGACCG CGGTGGACTA CGCCACCGCG CAGATCGGCC TGCCGTATCT GTGGGGTGGG 
GACGGCCCCG ATTATGGCGA GAAAGGCTTT GATTGTTCGG GGCTTACCCG GGCCGCCTAC 
GCCGCCGCCG GAGTCACCAT CCCCCGCGTC GCGCAGGCCC AGTTCAACGC CGGACCACGA 
CTACCCCCAG GGGCCCCACT GGAAATCGGA GACCTCGTAT TCTACGGCCC GTCCGACATT 
GACATCACCC ACGTGGGAAT TTACCTTGGC AGCGGGGAAA TGGTGAACGC GCCCCGGCGC 
GGGGCCCCGG TCCGGACCGA AACCTACGTC CGACCCAGCT ACCGCGGAGC CACCCGACCC 
GTCCCCGCGT CGGCCGGCTT TCCCTGA

Protein sequence

MTRLVLGLCA LLLAVPILAG GVAAGLLGGE AGGGEPASAA AAAGEIPVDY QRLYVTAAAT 
CPGLPWTVLA AVGKVETDHG QNPDWTSLAG AQGPMQFLPT TFAAYGVDGD ADGSTDINNP 
ADAVYSAAHY LCASGAQNGA NIPGALYTYN HDNSYVTRVL TQADVYTTSD LTTSSGPSDA 
ALTAVDYATA QIGLPYLWGG DGPDYGEKGF DCSGLTRAAY AAAGVTIPRV AQAQFNAGPR 
LPPGAPLEIG DLVFYGPSDI DITHVGIYLG SGEMVNAPRR GAPVRTETYV RPSYRGATRP 
VPASAGFP