Gene Franean1_5336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5336
Symbol
ID	5673670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6431591
End bp	6432943
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	65%
IMG OID	641244194
Product	hypothetical protein
Protein accession	YP_001509600
Protein GI	158317092
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.975729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.140148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCCA CCGGCGTCCG TCCCTGTCCG CTGGCGTCCG TGGCTGTTGC TACAGAGGTA 
GCTACACCTG GCGGGGCCTC CGACGCCCGG TGCCTGGACG AACCTTCCTC CGGCCTGGGT 
AGCCTGCGTG CCGTGGACGA TAAGTCACAG GTCGTTCCGT TTGTCGACCT CCCCACCGCC 
GCCCTTGTAG TCGATCAGCT GTATGAGGGG GGCACGGCGG GCACCCTTGC CGATGACCCT 
CTGGCGCGGC TGCTGCCTGT CGGCAACCAA GGAGGGTTTC GGTACGCGGG CTCCCCCCGC 
AAAGGCACCG TCCGTCTCTC GGTGCTTTAC ACCACCGGGG CAGTAGCAGA CTGGCCAGAC 
ACTCTCGATC CCTCGACCGG GGTCTTCACC TACTACGGCG ACAACCGCAA ACCAGGTCGG 
GACCTGCACG ATACCCAACG TTCTGGCAAC CTCCTCCTGC GTGACGTGTT TGAACACGCC 
CACGGCAGCG TGGAGGAACG CCGTACAGTC CCGCCGTTCC TGCTGTTCGA AACAGCGCCA 
CCGGGACGGC GCATCATGTT CCGTGGCCTA CTTGCCCCCG GCGCGGCCAC CCTCACCAGC 
GACGACGATC TCGTCGCGAT CTGGCGTAAC ACCCGCGGAC ACCGCTTCCA AAACTACCGC 
GCCCACTTCA CCGTGCTCGA CGTCGCGACC GTCACCCGCA CCTGGCTAAC CGACATCCTC 
GCCGGACACG CTACCGACAG CGAGCACTGC CCACCTGCGT GGACAGCCTG GGTCGACGGT 
CGCGCCTACA GCCCGTTGAT CGCACCTTCG ACCACCATCA TCCGGACCAA AGCAGAACAG 
CAACCCCCCG ACCCTACCGG GGTAGCGATA CTCGCCGCCA TCCGCGAGCA CTACCGGGGA 
CACGAACACG ACTTCGAGTT CTGCGCGGTC GAGCTGTGGC GACTCATCGC GCCAGCCACT 
GGCAGATGTG ATGTCACCCC GCCGAGTCGG GACGGGGGCC GCGACGCCAT CGGCGACTAC 
ATCCTCGGCC CACTCTCTGA CCCGATCGCC ATCGACTTCG CTTTGGAAGC CAAGTGCTAC 
ACCGACACCA ACTCCGTCGG CGTCCGAGAT GTCGCCCGGC TGATCTCCCG GCTACGCCAC 
CGCCACTTCG GCGTCTTCAT CACCACCTCC CACTTCAACC AGCAGGTCTA CACCGAAGTA 
CGCACCGACC GGCACCCCAT CGCCCTGGTC AGCGGACGCG ACATCGTCAA TGCCCTCCGC 
GCCCACGGCT ACGCGGACGT CAACGCCGTC AACGCATGGT TAGGCAAGAT CCCGAATGTC 
CATGTCTCCG CGAAGGGAGC ACCTAATCCG TAG

Protein sequence

MQSTGVRPCP LASVAVATEV ATPGGASDAR CLDEPSSGLG SLRAVDDKSQ VVPFVDLPTA 
ALVVDQLYEG GTAGTLADDP LARLLPVGNQ GGFRYAGSPR KGTVRLSVLY TTGAVADWPD 
TLDPSTGVFT YYGDNRKPGR DLHDTQRSGN LLLRDVFEHA HGSVEERRTV PPFLLFETAP 
PGRRIMFRGL LAPGAATLTS DDDLVAIWRN TRGHRFQNYR AHFTVLDVAT VTRTWLTDIL 
AGHATDSEHC PPAWTAWVDG RAYSPLIAPS TTIIRTKAEQ QPPDPTGVAI LAAIREHYRG 
HEHDFEFCAV ELWRLIAPAT GRCDVTPPSR DGGRDAIGDY ILGPLSDPIA IDFALEAKCY 
TDTNSVGVRD VARLISRLRH RHFGVFITTS HFNQQVYTEV RTDRHPIALV SGRDIVNALR 
AHGYADVNAV NAWLGKIPNV HVSAKGAPNP