Gene Franean1_2800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2800
Symbol
ID	5671189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3314242
End bp	3315441
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	641241709
Product	lanthionine synthetase C family protein
Protein accession	YP_001507129
Protein GI	158314621
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACAC TGTCCCGCCT CCCGACGGTC CCAGACCTCG GCGACGCCGA ATCGGCGCGC 
TGGGCTCAGT CCCTCGGCGA CGGAGCACCA GGGATCGCAC TGGCGCATAT CGCTCGGGCC 
CGTGCCGGCC TCGACGGCTG GGAACCCGTG CACCGTCTCG CGGCGGCGAT GACACGTAGT 
CCGCTCAACG CCCATCCGGA CACCGCCAGC CTGTACCAGG GCGCACCGGC CGTCGCCTAC 
GCCCTGCATA TCGCCGGCCA CCGGGCCTAC GACGCCGCGC TCGCCACCCT CGACGAGGCC 
ATCGCCACCG TCATCCGGCG CCGTCTGGAG GCCGCCCACC GCCGCATCGA TCACGAACAG 
CTGCCGCACG CCGGCGAGTA CGACCTGATC AACGGGCTCA CCGGCCTCGG CGCACTCCTC 
CTACACCACG ACCGCGAAAG CGCTCTTCTC CGGGACGTAC TCGCGTACCT GGTGCGGCTG 
ACCCGACCCA TCCGTGTCGA TGGCCGCGAC CTGCCCGGCT GGTGGGCAAC GGGCAGCCCC 
GACCGCCGCG CCTCCGCCCG ATGGAACGCC GGCCATGCCG GCTTCGGCAT GGCCCACGGC 
ATCGCCGGGC CGCTGGCGCT CCTGGCCATC ACCATGCGGC GGGGGATCGC CGTGGCGGGA 
CACGTCGACG CGCTCCACAA CATCATCGCG TGGCTCGACC AGTGGCGCAG AGGGCAGAGG 
CGGACTGGCT GGTGGCCCGA GGCGATCGAC CACGACGAGC TGCGTACCGG CAGCGCAGCC 
TCCCCGGGGC CACCTCGGCC GTCCTGGTGC TACGGCAGTC CCGGCATCGC CCGAGCCGAA 
CACCTCGCGG CCCTTGCCCT CGGCGACCAA CAACGAGCCT TCGATGCGGT CGAGACCCTC 
ATCGGATGCC TCAGCGACGA CCACCAGCTC GCGCAGCTCA CCGACGCGGG ACTCTGCCAC 
GGCTGGGCCG GCCTCCTCCT GACCGCTCAT CGGGCCGCCG CCGACACCAG CACCGGCGAA 
CTCTCCGCCG CCCTGCACGC CGCCGAAACA CACAGGCACC GGTACCTCCG CGGCAACAGC 
GACCCCACCG CCGCGGGTTT CTTAGACGGC GCGGCTGGCA TCGCACTCGC CCATGCCGCC 
CTGAAGATCA CATCCGGCTC GGCGCTGCCA GACTGGGACC GCTGCCTGTT GATCAACTAG

Protein sequence

MTTLSRLPTV PDLGDAESAR WAQSLGDGAP GIALAHIARA RAGLDGWEPV HRLAAAMTRS 
PLNAHPDTAS LYQGAPAVAY ALHIAGHRAY DAALATLDEA IATVIRRRLE AAHRRIDHEQ 
LPHAGEYDLI NGLTGLGALL LHHDRESALL RDVLAYLVRL TRPIRVDGRD LPGWWATGSP 
DRRASARWNA GHAGFGMAHG IAGPLALLAI TMRRGIAVAG HVDALHNIIA WLDQWRRGQR 
RTGWWPEAID HDELRTGSAA SPGPPRPSWC YGSPGIARAE HLAALALGDQ QRAFDAVETL 
IGCLSDDHQL AQLTDAGLCH GWAGLLLTAH RAAADTSTGE LSAALHAAET HRHRYLRGNS 
DPTAAGFLDG AAGIALAHAA LKITSGSALP DWDRCLLIN