Gene Franean1_5411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5411
Symbol
ID	5673742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6527763
End bp	6529334
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	71%
IMG OID	641244266
Product	hypothetical protein
Protein accession	YP_001509672
Protein GI	158317164
COG category
COG ID
TIGRFAM ID	[TIGR02946] acyltransferase, WS/DGAT/MGAT

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0824617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCTC GGCCGCTTAC TCCGATGGAC GCGCTCATAC TCGGATACCA GCGAGCATTT 
CCGAAGACGC CGCTCGCGGT CGGTTGCCTG TTGGTCGCCG ACGGCCCCGT GCCAGGAGTC 
CAGGCGTTGC GCGAGCTCGT CGCGGACCGG GCACACGACT TTCCTCCACT GGCCCACCGG 
ATCGCCTCGG CCGGGCGTGG CCGGCCGGTC TGGGTGGCGG ACGCCGATTT CGACCCGGCC 
CGGCACGTTC ACGAGTACCG GCTCCCCGCG GAGTCGGGGC TCGCCGGACT GCGCGAGGCG 
GTGGGGCGGC TGTCAGCGGT CGAGATCTCG TTGGACGCGC CGCCGTGGCA GCTCTGGTTG 
CTCCACGGCC TCCGCCGCAA CGGCTTCACC CTGCTGTACC GCGCCAGCCA CGTGTGGACA 
GACGGGACGG CACTGAACCT GGTGCTGGAA AAGCTGTTCG GCCTGTCCGA CCCAGGATCG 
GAGCGCGCAC CTCTGCGGGT GTCGCCGGAT CGCCGGCCCG GCCCCCGAAC CGTCTGTCGG 
GCCGCCACTC ACTCACTCGG ATGGCTTACC CGGACGTCCA CGATCGGTCC GCTCTCGGCG 
GCACCCACGG GATACCCGCA CCACACCTGG CTGGAGGTGG ACCTGTCCAG GCTACGGGCG 
ATCAGCCGCG CCTACGAGGT CACCGTGAAC GACATCTTCC TGGCCGCGCT CACCGGCGCT 
CTGCGTGCCT GGCCGCGCCC CGGCTCCGAT CGGCCCGGCC AGCGCCGGGG CCAGATGCAC 
GCCGCGATGC CGGTCAGTAC CCGCCGGGCA GCCCAGCGGG ACCACATGAG CAACTACCTG 
ACCACCGTAC GGATCGCGCT GCCTTACGGT GAGTCGTTGA TCCACCGGCG TGTGGAGGCG 
ATCCACCGGC AGACCGTCCG ACACAAGCGG GGCGGGACTC CGGGCGTCGC GGAACATCTC 
TTCCTCTGGG CGATTCCCGA ACCGTTGCGA CCGGCCGTGC TGTCCACCGG GATCATGTCC 
CACGTCTTCG CGCTGACCGC ATCCAACCCG GGCGGCCTGA CCGGCCCGCT GGAAATCCTC 
GGCCGACCAG TCACCGCCGC CGTGCCCACC CCTCCGCTCC CCGCAGGCCA ACGCCTGGCA 
GTCCTGCTCG GCGGGCTGGA CGGGCAGGCG TGCATCGGTT TCACGATGGA CGGGTCGGTG 
CGGGACGGGG CGCGACTGCC GGAACTCGTC GAGGCCGAAC TGGACGCGCT CGAGGCAGCG 
GCCGGCCTCC GCCACGGCCC GGCCCGGAGC CCGGCCGAGA CCACGCATTC GGCACGGCCG 
CATCCGGTCG CCATGACCGG TATCGGCACC AGCGCTATCG AGGCGGCGGG TCTGGTGGGG 
CGCGGTGCTT ATCACCTTCG TCGCTGGCTC ACACGGGGCC AGCGGACCGA CACGCCTGGC 
ACGGAACTGG TTCAGGGCAC CAGCGACGCG GCAGGTCGAA CGCCCTACAG TCAACTCTGC 
TCCCGACGGC TCCAGCAACC CCGGCCAGCC GGTGCTTCGC CAGCAGAGGA GAGGCGAGTA 
CTACATTCCT AG

Protein sequence

MTARPLTPMD ALILGYQRAF PKTPLAVGCL LVADGPVPGV QALRELVADR AHDFPPLAHR 
IASAGRGRPV WVADADFDPA RHVHEYRLPA ESGLAGLREA VGRLSAVEIS LDAPPWQLWL 
LHGLRRNGFT LLYRASHVWT DGTALNLVLE KLFGLSDPGS ERAPLRVSPD RRPGPRTVCR 
AATHSLGWLT RTSTIGPLSA APTGYPHHTW LEVDLSRLRA ISRAYEVTVN DIFLAALTGA 
LRAWPRPGSD RPGQRRGQMH AAMPVSTRRA AQRDHMSNYL TTVRIALPYG ESLIHRRVEA 
IHRQTVRHKR GGTPGVAEHL FLWAIPEPLR PAVLSTGIMS HVFALTASNP GGLTGPLEIL 
GRPVTAAVPT PPLPAGQRLA VLLGGLDGQA CIGFTMDGSV RDGARLPELV EAELDALEAA 
AGLRHGPARS PAETTHSARP HPVAMTGIGT SAIEAAGLVG RGAYHLRRWL TRGQRTDTPG 
TELVQGTSDA AGRTPYSQLC SRRLQQPRPA GASPAEERRV LHS