Gene Franean1_5364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5364
Symbol
ID	5673698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6469229
End bp	6470287
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	69%
IMG OID	641244222
Product	hypothetical protein
Protein accession	YP_001509628
Protein GI	158317120
COG category	[V] Defense mechanisms
COG ID	[COG0842] ABC-type multidrug transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAGC GAGTCCCCAC CCGACAGCCC CACGACCACA TCCTGGACGT GGCCCATCCG 
CCTCCCCGCC CTGGAACCTC GCGGGCCGTC TTGCTTCCGG TAGCGATCGT CCTGCTGATC 
GGCACCGTGT TCGTCAGTGT CTATCTCGCT GCCTTCCACG CGCCGCGCCC CCATCAGCTC 
CGCGTGGGCA CAACGATGAT CGGCACGCAT CAGGTGGACC TGCGCCGGGA TCTCGCGCGC 
GCCATCCCCG GCGGCTTCAC GCTCGAGACC TACCCCGACG AATCCACCGC CCGGCAGGCC 
GTCCAGCACA GGTTCGTGTA CGCGGCCTAC CTCGGCGGGG GGAGGTTGCT CTACGGCAGC 
GCCAATGGAG CCGCCGTCAC CGCAACTATG ACCACTGCTT TCGGTTCCGT GGCCCGCGCG 
GAGCACGATC ACCTTTCTGT CGAGGACGTT GCCCCGGCAG CAGCGGGGGA CACTCGGGGG 
CTGTCCGTCT TCTACACAGC CTTCGGCCTG GTGCTCGCCG GCTACCTTTT CGGCATGACG 
ACCTACCAGG TCGCACCCCG GCTCCAGTAC CGCTGGCGTA TGGCCAGCCT GGCCTTGTTC 
GGAGTTGTCG GCGGCGTCCT CGTCGCCGCC ATCGCCGGGA GCGCGGGCTT CGGTGCGCTA 
CCCGGCCCCT TCCTGCCCCT CGCCATCATC GTCGCGCTGA TGGGCGCCGC GGTCGGCGCC 
ACGACCATGG TGCTGCTGCG GCTGTTCGGC TCCGCAGGCG TCAGTCTCGC CTCGATACTC 
CTGCTGATCC TTGGCAACGC CAGCAGCGGC GGGATCATGC CACCGGCTTA CCTTCCTGCT 
TGGCTACGCC CGCTGTCTGA GATCCTGCCC GTCGGGGTGG GCGTCCGCGC AATGCAGGGG 
CTGTCCCGGT TCCAGAACGA CGGTTTGTCC CGCGCCCTGG TGATCCTCCC GCTGTGGGTG 
CTCGGCGCCG CCGTGGTGCT CCACCTGAAG GACGTGTTCC GGCGCGATGA TCCGAGTGGC 
GCGCGAGACA AGGACGAATC TCAGCCTGCG GTGGGCTGA

Protein sequence

MSQRVPTRQP HDHILDVAHP PPRPGTSRAV LLPVAIVLLI GTVFVSVYLA AFHAPRPHQL 
RVGTTMIGTH QVDLRRDLAR AIPGGFTLET YPDESTARQA VQHRFVYAAY LGGGRLLYGS 
ANGAAVTATM TTAFGSVARA EHDHLSVEDV APAAAGDTRG LSVFYTAFGL VLAGYLFGMT 
TYQVAPRLQY RWRMASLALF GVVGGVLVAA IAGSAGFGAL PGPFLPLAII VALMGAAVGA 
TTMVLLRLFG SAGVSLASIL LLILGNASSG GIMPPAYLPA WLRPLSEILP VGVGVRAMQG 
LSRFQNDGLS RALVILPLWV LGAAVVLHLK DVFRRDDPSG ARDKDESQPA VG