Gene Franean1_1215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1215
Symbol
ID	5669628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1449976
End bp	1451175
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	641240147
Product	DNA (cytosine-5-)-methyltransferase
Protein accession	YP_001505575
Protein GI	158313067
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0567342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0860408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGCGGG CGTTCAAGTT CCTGCTCCGC CCGACGGCGC GGCAGGCCAC CGCGCTGACG 
GCGATGATCG ATGATCATCG GGCGCTCTAC AACGCCGCGT TGCAGGAACG ACGCGACGCC 
TACCGGCATC CGTCGAAGGC GACGGTTCGC TACGGCGACC AGTCCGCCCA GCTCAAGGAG 
ATCCGCGCCT GCGACCCGGA TCAGGGCCGC TGGTCGTTCT CCTCCCAGCA GGCCACCCTG 
CGTCGCCTCG ACAAGGCGTT CGCCGGCTTC TTCCGCCGCG TCAAAGCAGG CGAGACCCCT 
GGCTACCCGC GGTTCAGAGG CGCGGGCCGG TTCGACACGG TCGAGTGGCC GAGGGACGGG 
GACGGCTGCC GCTGGAACTC CCAGCCTGAG CATCCCACCC GGACCCGGGT CCGGCTTCAA 
GGTGTCGGTC ACGTCAAGGT TCACCAGCAC CGGCCGGTGG CGGGCACGGT CAAGACGGTC 
TCGGTGAGGC GGGAAGGCCG CCGCTGGTAT GTGGTCCTCT CCTGCGACGA CGTGCCCGCG 
CGGCCGCTGC CGGCCACCGG GGTGGTGGTG GGGGTGGATA TGGGTGTGGC GTCGCTGGTG 
ACCCTCTCGG ATGGCCGTCA GGTCGGTAAC CCGCGTTTTC TTGCCGCGGC GGCCGGTCGG 
CTCGCGCGTG CGCAACGGGA ACTGGCCCGT AAGAAGCGGG GGTCGACCCG GCGCCGGAAG 
ACCGTCGCGA AGGTCGCCGC CCTGCACCGC AGGGTTCGCC GGCAGCGGCT CGACCTCGCC 
CACACGGTCG CACGCGACCT GGTCCGCGAC CACGATCTGA TCGCCGTGGA GGCACTGCGG 
ATCGTGAACA TGACCCGCCG GGCCGTGCCG AGACCCGACC CCGACCGGCC CGGAGCTTTC 
CTGGCGAACG GGCAGGCGGC GAAGTCCGGA TTGAACAGGA GCGTTCTCGA CGCGGGGTGG 
GGGGTGTTCC TCGCCGTGCT GCGTGCCAAG GCTGAAAGTG CCGGACGGGT GGTCGTCGAG 
GTGAACCCCG CCAACACCTC CCGCACGTGT GCGGTCTGCG GGCACTGCCA CGCCGACAAC 
CGCAGGACAC AGGCCGCGTT CGTCTGTGTC GCGTGCGGGC ATGCCGCGCA CGCCGACGTG 
AACGCGGCGA TCAACATTCT TCGGGTCGGG CTGGCCCGTC AGGGCGCGGA AGCGGCCTGA

Protein sequence

MRRAFKFLLR PTARQATALT AMIDDHRALY NAALQERRDA YRHPSKATVR YGDQSAQLKE 
IRACDPDQGR WSFSSQQATL RRLDKAFAGF FRRVKAGETP GYPRFRGAGR FDTVEWPRDG 
DGCRWNSQPE HPTRTRVRLQ GVGHVKVHQH RPVAGTVKTV SVRREGRRWY VVLSCDDVPA 
RPLPATGVVV GVDMGVASLV TLSDGRQVGN PRFLAAAAGR LARAQRELAR KKRGSTRRRK 
TVAKVAALHR RVRRQRLDLA HTVARDLVRD HDLIAVEALR IVNMTRRAVP RPDPDRPGAF 
LANGQAAKSG LNRSVLDAGW GVFLAVLRAK AESAGRVVVE VNPANTSRTC AVCGHCHADN 
RRTQAAFVCV ACGHAAHADV NAAINILRVG LARQGAEAA