Gene Franean1_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1868
Symbol
ID	5670270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2243955
End bp	2245592
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	74%
IMG OID	641240790
Product	apolipoprotein N-acyltransferase
Protein accession	YP_001506212
Protein GI	158313704
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0815] Apolipoprotein N-acyltransferase
TIGRFAM ID	[TIGR00546] apolipoprotein N-acyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0610408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA GCGCCGGCCG CCCCGTGTCC GTCGACGCGG GCGGGCATGT GCGGCTGGTG 
CCGACCCGGT GGTCCCGGTG GCGGTACCGG GCGCTGTCCG CGTTGCTCGG GGCGGTGCCC 
GCCGTGGCGT TCCCCGCGCT GTCGGCATGG CCGGTCGGCT TCGTCGGGAT GGTGCCGGCA 
ACCCTGGTGA TCGTGGCGGC CACCGTCCCG CGGGAGGCGG CGATCCGTGC CTGGTGCGGC 
GGTACCGGGT TCTTCCTGGC GACCTGCTAT TGGCTGGTTC CGAACACCGG TCCGTTCATC 
GTCGTCCTCG GCCTGGCGCT CGGCGTCACC TGGATGCTGT GGGGCGTCCT GGTCTGGACG 
GCGCTGCGCC CCCGGCTGCC CTCCCAACCG CCCGGGTACC GCCGTCTCGC CTGGGCGCTG 
GTCGCCGTCC CGTCCGGCTG GGTGATCGGG GAGTTCGCCC GGTCGTGGGA GGGCTTCGGT 
GGGCCGTGGG CGCTGCTCGG TGCCAGCCAG TGGAACGCCC GACCGTTTCT GCCGCTGGCC 
GCCGTCGGCG GGGTGTGGCT GCTGAGCTTC CTGCTCGCCG CCGTCAACCT GCTGGTGGCT 
GCGGCGGTCA TGCCGGGCCT GCGGCCGGGG CGGCGGCGAC CGTGGCGGGC CGGCGTCGCG 
CTAGCAGCCG GCCTGCTCGT TGCCGTGATG GTGGCCGGTG CGGCGGCCGT GCCCACCCCG 
GCCAACACCG GCACGCTCAC CGTTGGTGGC GTCCAGCCAG GCGTCGTCCA CGGTGCCGAC 
GTGCGGTTCG CCGACGGTGA GGCGGCCACC AGAAGCCTGG TCGGCGCCGG GGTCGACCTG 
GTGGTGTGGG GGGAGAGCAG CGTCGGGTTC GACCTCGTCG ACGACCAGGC ACGGCTGCGC 
CAGCTCGAGG ATCTGTCCCG CATGCTCGGT GTCCCGGTCT TGGTCAACAC CGATGCGCGG 
CGTGCTGATG AGGTCGCCGG CCCCGACGAT GGGGACGGGG GGATCTACAA GTCGGCAGTG 
CTGGTCGGAC CGGACGGCCC GCGCGGGCGG TACGACAAGA TGCGGCTGGT GCCGTTCGGG 
GAGTACATCC CCCTGCGCCC CGTCTTCGGT TGGCTGACCG CGGTGACCGA GGCAGCCGCC 
GAGAACCGCC GCAAGGGTGT CCGGCTTACC GTGCTCGCCG CGGGGAAACT GGACGGCAGG 
ACGATCCGGC TCGGTCCGCT GGTCTGCTTC GAGTCGGCCT TCCCGGACAT GACTCTCCGT 
CTGGCGAACG ACGGCGCGGA CGTGGTCGTC GTCCAGTCGG CCACCTCGAC CTTCCAGGAC 
AGCTGGGCAC CCGATCAGCA CGCCAGCCTC GCCGCGCTGC GGGCGGTCGA GGCGGGACGG 
CCTGTCCTTC ACGCCACGCT GACCGGCGTG TCCACCGCCT TCGACGCCTC CGGCCGGCAG 
TTGTTCCGCC TGGGCAGGGA CGGGCGCGGC GCCTATGTCG TAGACCTGCC GCTGACCAGC 
GCGACCGGCA CCCCGTATGC CCGCCTCGGC GACTGGGTGC CCCTCGGCTC GCTCGCCATC 
GTCGCGGCCG TCGCGCTCGA TGCCGCGGTG CTGCGGGCGG TCCGTCTGCA CCGCGCCAGG 
CGCTCCACGA CGGGGTGA

Protein sequence

MASSAGRPVS VDAGGHVRLV PTRWSRWRYR ALSALLGAVP AVAFPALSAW PVGFVGMVPA 
TLVIVAATVP REAAIRAWCG GTGFFLATCY WLVPNTGPFI VVLGLALGVT WMLWGVLVWT 
ALRPRLPSQP PGYRRLAWAL VAVPSGWVIG EFARSWEGFG GPWALLGASQ WNARPFLPLA 
AVGGVWLLSF LLAAVNLLVA AAVMPGLRPG RRRPWRAGVA LAAGLLVAVM VAGAAAVPTP 
ANTGTLTVGG VQPGVVHGAD VRFADGEAAT RSLVGAGVDL VVWGESSVGF DLVDDQARLR 
QLEDLSRMLG VPVLVNTDAR RADEVAGPDD GDGGIYKSAV LVGPDGPRGR YDKMRLVPFG 
EYIPLRPVFG WLTAVTEAAA ENRRKGVRLT VLAAGKLDGR TIRLGPLVCF ESAFPDMTLR 
LANDGADVVV VQSATSTFQD SWAPDQHASL AALRAVEAGR PVLHATLTGV STAFDASGRQ 
LFRLGRDGRG AYVVDLPLTS ATGTPYARLG DWVPLGSLAI VAAVALDAAV LRAVRLHRAR 
RSTTG