Gene Franean1_1288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1288
Symbol
ID	5669701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1553891
End bp	1555051
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	74%
IMG OID	641240220
Product	hypothetical protein
Protein accession	YP_001505648
Protein GI	158313140
COG category	[R] General function prediction only
COG ID	[COG3211] Predicted phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.930248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCGCC GCACCGTGCT GCGCCTGGCG CTCGCGAGCG CCGGGGTGGC CGCTCTGTCC 
GGAGCGAGCT GGGCACCCGC GCTCGCCGCC ACCGCCCGAC CGGGCGAGGG CCCCTATGGC 
CTCCCTCAGG CACCCGACGC CGACGGGGTC GCCCTGCCCC GCGGGTTCAC CAGCCGGGTG 
GTCGCCCGTT CGCGCCAGGT CGTCCCCGGC ACGGATCTCG AGTGGCACGA CGCCCCGGAC 
GGCGGCGCCT GCTTCCCCGC CGGAACGGGT TGGACCTATG TCTCCAACTC CGAGACGACG 
TGGCGCGGGG GCGCCTCGGC GCTGCGCTTC GACGCCACCG GCACGATCGT CTCGGCCAGC 
AGGATCCTGC GGCGTACCTC GGCCAACTGC TCGGGCGGGG CGACGCCGTG GGGCACCTGG 
CTCTCCTGCG AGGAGCACGC GTTCGGGCAG GTGCACGAGA CATGGCCGGA CGGCCGCCGG 
GACGCGGTGG CACGCCCCGC GATGGGGCGG TTCACCCACG AGGCGGCCGC CTGCGACCCC 
GACCGCCAGG TCGTCTACCT CACCGAGGAC CGCCGCGACG GCTGCTTCTA CCGCTTCCGC 
CCGGCCCGGT GGGGCGATCT GTCCGCGGGC GTCCTGGAGG TGCTGGTCGC ACCCGAGGAC 
ACCGAGTCCG GTCCGGTGCG CTGGGCGCGG GTCCCCGACC CGGACGGCCT GCCGCGCTCG 
ACCCGCAGGC AGGTCTCCGA CGCCCGCGCC TTCGACGGCG GCGAGGGCTG CTACTACGTG 
GCGGGCACCT GCTTCTTCAC CACCAAGGGC GACAACCGGG TCTGGGCCTA CGACGCGGTC 
GGCGAGCGGA TCTCCGTGCT CTACGACCCC GAGCAGGTCC CGCGCGGCGG AACGCGGATG 
ACGGGCCCGG ACAACATCAC CGGATCGGCC GCCGGCGACC TGTTCATCGC CGAGGACAAC 
CCCGGGCCGG CACTGCACAT GATCACAAGT GCCGGCGTCG TCTCCCGTTT CCTGCACCTG 
CCGGACCATC GCCGCTCCGA GATCACCGGC CCGGCCTTCA GTCCCGACGG GCGCCGGCTG 
TACTTCTCCT CCCAACGGGG GAAGGACGGG CGCGGCCGGA CCGGGATGAC CTTCGAGGTG 
TCCGGTCCGT TCCGGCGGTG A

Protein sequence

MDRRTVLRLA LASAGVAALS GASWAPALAA TARPGEGPYG LPQAPDADGV ALPRGFTSRV 
VARSRQVVPG TDLEWHDAPD GGACFPAGTG WTYVSNSETT WRGGASALRF DATGTIVSAS 
RILRRTSANC SGGATPWGTW LSCEEHAFGQ VHETWPDGRR DAVARPAMGR FTHEAAACDP 
DRQVVYLTED RRDGCFYRFR PARWGDLSAG VLEVLVAPED TESGPVRWAR VPDPDGLPRS 
TRRQVSDARA FDGGEGCYYV AGTCFFTTKG DNRVWAYDAV GERISVLYDP EQVPRGGTRM 
TGPDNITGSA AGDLFIAEDN PGPALHMITS AGVVSRFLHL PDHRRSEITG PAFSPDGRRL 
YFSSQRGKDG RGRTGMTFEV SGPFRR