Gene Franean1_1333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1333
Symbol
ID	5669744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1605101
End bp	1606411
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	74%
IMG OID	641240264
Product	lanthionine synthetase C family protein
Protein accession	YP_001505691
Protein GI	158313183
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.551355
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCG TCATCGACAC GCGAGTACGC GCGGCCACCG TCGCGACGCG GCTGGCCGAC 
GCGCTGACGG TGCCGCCACC ACCCGAGCCA GACGGCGACC GGAGCCCGAG CAGCCCACGC 
TGGCAGGGCC AGTCGCTGGC CGAGGGAGCG GCCGGCATCG CGGTTCTCCA CGGCGTACGC 
GCCCGCGCCC ACGCTGGGGA GTGGGCCACG GTCGATGCCT GGCTGACGGC CGCTGCCAGG 
GAAGACCTTT CGGTCGGGCC GGGTGCGGGC CTGTGGTTCG GCGCCCCGGC GCTTGCGCTC 
GCGCTGACCG CGGCAGCCCC ACCCGGCCGC CACCTCGGCG CGGCCCGGCA GCTGCACACC 
GCCGTCGAAA GGCTGACCGA GCGCCGGCTC GCGGCGGCCC ACGCCCGGAT TGATGCCGGA 
CAGCGACCGG AGCGCGCCGA GTTCGACCTG GTCCGAGGCC TGACCGGGCT CGGCGCCTAT 
CTGGCGACCC GCAACCCCGA CGGCGAGCAG CTCCGCCAGA TCCTGACCTA CCTTGTCCGA 
CTCACTGAAC CGCTACCCGC CACGGACACG GCCGGGCTGG CCGCGCCAGG CTGGTGGACC 
ATCGACGTTC CCACCACCGC GCCACCCGGA CCGTTCGCCG ACGGCCATGC CGATCAGGGC 
ATGGCCCACG GCATCGCGGG GCCGCTCGCA CTGCTGGCGC TCACACACCG CCGTGGGGTC 
ATCGTCCCCG GCCACACCGA CGCCCTCGAC CGGATCTGTC ACTGGCTGGA CACCTGGCGC 
CAGGACGGCC CCGCCGGGCC CTGGTGGCCC GAACGGATCA CCGCCAGTGA GTTGCTGACA 
GGCCGGGCCG CCCAGCCCGG CCCAGGCCGC GCATCCTGGT GTTACGGCAC TCCCGGCCTG 
GCCCGCGCCC AGCAGCTCGC CGCGGTCGCG CTGGCCGACA CCACCCGGCA ACAACGCGCC 
GAGGCAGCCC TCGCAGCCTG CGTCACGGAC CCCGCCCAGC TCGCCCGGTT CGTCGACCCG 
GCGCTCTGCC ACGGCTGGGC GGGCCTGGTC GCCACCGTTC GCTGCGCAGC CGCGGATGCC 
CGCTTCTACC CGCTCGACAG CCACCTACCC AGCTTGGTCA AGCAGCTCCT CGACAGCCTC 
GACGCGGCGC AAGGCGCCGA CTGGCAGCTA CCCGGCCTCA TTGAGGGCAC GGCAGGAATC 
GCCGCGGTCC TGCATGCCGT GGCGACCAAC ACCACCACAG CCTGGGAGTC CGCCCTCCTG 
CTCGACCTCC CCCCGGCTTG GCCGGCAGGG GACCGGGGAG CCGAAGCATG A

Protein sequence

MTVVIDTRVR AATVATRLAD ALTVPPPPEP DGDRSPSSPR WQGQSLAEGA AGIAVLHGVR 
ARAHAGEWAT VDAWLTAAAR EDLSVGPGAG LWFGAPALAL ALTAAAPPGR HLGAARQLHT 
AVERLTERRL AAAHARIDAG QRPERAEFDL VRGLTGLGAY LATRNPDGEQ LRQILTYLVR 
LTEPLPATDT AGLAAPGWWT IDVPTTAPPG PFADGHADQG MAHGIAGPLA LLALTHRRGV 
IVPGHTDALD RICHWLDTWR QDGPAGPWWP ERITASELLT GRAAQPGPGR ASWCYGTPGL 
ARAQQLAAVA LADTTRQQRA EAALAACVTD PAQLARFVDP ALCHGWAGLV ATVRCAAADA 
RFYPLDSHLP SLVKQLLDSL DAAQGADWQL PGLIEGTAGI AAVLHAVATN TTTAWESALL 
LDLPPAWPAG DRGAEA