Gene Franean1_6141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6141
Symbol
ID	5674462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7470434
End bp	7472833
Gene Length	2400 bp
Protein Length	799 aa
Translation table	11
GC content	75%
IMG OID	641244993
Product	acyltransferase 3
Protein accession	YP_001510391
Protein GI	158317883
COG category	[I] Lipid transport and metabolism
COG ID	[COG1835] Predicted acyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGCCG GTTCGCTTCC GATGACCGAC GGCCCGCCGG GGGCGGCCAG GCGGGCGAAG 
CCCACCCCGC GCCCGCCGGC CGGGCCAGCC GAGACCCGGC AGCCCACCGA CGCGGAGGCG 
ACGGCGGCGG CGAAGTTCGC CTACAACCCG GCGCTCGACG GTCTGCGCGT GATCTGCATC 
TACATCATCC TCGCCGGTCA CATGGGCGCC ATCCACGCCA GCAACGTGGC CGTCGACATG 
TTCTGCGTGC TCAGCGGGTT CCTGATCACG ACCCTGCTGC TGGCCGAGCA GGCCCGCACG 
GGCACCGTCT CGATCGGGCG CTTCCTCGTC CGGCGTGCGT ACAAGCTGAT GCCGGTGATG 
TGGGTCTACC TTCTGGTCGG CCTGGCCATC ACGGTCGCCT TCAAGTGGGA TGACATCCCA 
TACCGTGACG ACTACATCAA GAGCGCCCTC TCGACGTTCC TCAACGTCAA CAACTGGTAC 
AAGGTCGAGA ACCCGCTGGG CGGCGGGCGC TGGCTGGCCC ACGTCTGGTC GTTGTCGATG 
GAGGAGCAGT TCTACCTGGT CTGGCCGTGG GTCTTCCTGC TCTTCGTCCG CTCCGCGCGG 
CTGCGCCCGT ACCTGTTGAC GTTCCTGATC GCCTCGATCG GCCTGATCAT GGGCTGGACG 
TACATGATGG CCGCCAACGG GGCCCCGCGC AGCCGGGTCT ACCTCGCGCC CGACACCCAC 
ATCGCCCCGC TGCTCATCGG CTGCCTCGTC GCGGTCTGGC GGGACAACCG GCTGCGCGCG 
CTGGCGACCC CGGTGGTCCG CGACAGGAAG GACGGCGACA GGAAGGACGG CGGCGGGAAG 
GGCGACGGTA AGAAGGCCGC GACCGGAGCT CACTCCGCGG CGACCGCCGC CGCCGTCGAA 
CGCTGGACGA GCGGACGGCG ACTGGCCGCC CTCGGCCTTC CCGCCGGCAT CGTGCTGTTC 
CTGCTGGCCT TCCTCGGGCC GAACAAGGAT CTCCCGGAAC CGAACTGGAT CGACTACGGG 
GCCTACGTGC CGAGCGCGGC CCTGGGCGCG TTGCTGATCA TCGGCGCCGA CGTCAACCGG 
GACGCCCGGT GGGTGCGGCT GCTCGGCTCG CCGAAGATGG CCTGGACCGG AAAGATCACC 
TACAGCATCT ACCTGTGGCA CTACCCGTTC ATCTCGGCCG CCGCCGGCCA GCTCGTGCCG 
CGGATCGGGC TCTGGCCGTC GGTGGTCGTC GCCGCAGTCT GCACCACGAT CACGGCCTAC 
TTCTCGAACC GCTTCATCGA GAAGCCGGTC ATAGCGCGCC GTCCGAAGTG GGCGGACACC 
CCGCGTGGCC CGGCCCGCCC CGCCGCCGGC GCGGGCCCGG CGGGGGCCCC CGCCCAGGCG 
CCGGCCAAGG CCGGCCCGCG GGAGCCGCGG GAGCGGGACC TGTCCGAGCT GCCCGAGCTG 
GAGCCGGTGC TCGCCGGTGT CGGCACGAGC GCCGCCGACG CCGAGCAGGC GGACGGGCGC 
GGTGGCCGGG CCGGCGCCCC GCCCCGGCCG GGAGACTGGT TGGACAGCGA CGTCGACTGG 
GTGGACGAGG GTTACCCGGG CCGCGGCGGC CCGGCCGGGC ACGGGCCGGC CCGGTCCGGC 
TACTCCCACG ATCCGGATTC GCAGCCGATG CCGGCCGTTC CGCGCCCGAG CGGGCCCCGG 
GCCGGCGAGG TGGTCTACGA CCGCGCCGAC GGGCCACCCG TGTACGAACA CGGGCCGGCG 
GTGGGCGCTA CGCACGCCGG CGGGTTCGAG CCGACCCCCA TCCCGGACTG GGCGGCCTAC 
CCGGCCCTCA ACCGCGGCCC CGGATCGGCC GCGGACGCGG GCCCGGCCAT GGGTGCTCCC 
CGGCAGGGGC CGGCGGCGTC GATGGGCGGC GACACCATGA ACCTCCACCT TCCCTCGACG 
TTCGACCCCG GCGCGCCCCC TGCCCACGGG ACCGGCCCGC GGGCCGGGCA CGACCGCCCC 
GGCCGTCCGG CCGATCCCGC CGAGCCCGGC CGCCTGCCCG GGGTCGCCCA TCCGGCCGGC 
CACCGGCCCG GCCCGGCACC CGGCCACGCG CCCGCGTACG CCCACGGCCA GGCCCTGGGC 
CACGTGCCGG GCCACGGTCA CGTGCCGGGG CCCGGTCATG CGCCGGCGTA TGGCCACGGC 
TCGGGGAACG GTCATGGCCC GGGGAACGGC CACGGCCCGG CATACGGGCG GGGGCCCGGG 
GAGAGCAGGG GTCCCGGGCG TGACCAGGGC CTCGACCGTC TCGACGGAGC CGGGCACGGC 
CCCGCAGACC ACGCCGGGGA CCACGTGCTC GAGCCCGTCC GGGATCCGCG CGCCGGGCGG 
GAGCCCGCCG AGCCCGACCC GCTGTTCGGG CCGGTCCCGG GCGCGGGGCG CGACTGGTGA

Protein sequence

MRAGSLPMTD GPPGAARRAK PTPRPPAGPA ETRQPTDAEA TAAAKFAYNP ALDGLRVICI 
YIILAGHMGA IHASNVAVDM FCVLSGFLIT TLLLAEQART GTVSIGRFLV RRAYKLMPVM 
WVYLLVGLAI TVAFKWDDIP YRDDYIKSAL STFLNVNNWY KVENPLGGGR WLAHVWSLSM 
EEQFYLVWPW VFLLFVRSAR LRPYLLTFLI ASIGLIMGWT YMMAANGAPR SRVYLAPDTH 
IAPLLIGCLV AVWRDNRLRA LATPVVRDRK DGDRKDGGGK GDGKKAATGA HSAATAAAVE 
RWTSGRRLAA LGLPAGIVLF LLAFLGPNKD LPEPNWIDYG AYVPSAALGA LLIIGADVNR 
DARWVRLLGS PKMAWTGKIT YSIYLWHYPF ISAAAGQLVP RIGLWPSVVV AAVCTTITAY 
FSNRFIEKPV IARRPKWADT PRGPARPAAG AGPAGAPAQA PAKAGPREPR ERDLSELPEL 
EPVLAGVGTS AADAEQADGR GGRAGAPPRP GDWLDSDVDW VDEGYPGRGG PAGHGPARSG 
YSHDPDSQPM PAVPRPSGPR AGEVVYDRAD GPPVYEHGPA VGATHAGGFE PTPIPDWAAY 
PALNRGPGSA ADAGPAMGAP RQGPAASMGG DTMNLHLPST FDPGAPPAHG TGPRAGHDRP 
GRPADPAEPG RLPGVAHPAG HRPGPAPGHA PAYAHGQALG HVPGHGHVPG PGHAPAYGHG 
SGNGHGPGNG HGPAYGRGPG ESRGPGRDQG LDRLDGAGHG PADHAGDHVL EPVRDPRAGR 
EPAEPDPLFG PVPGAGRDW