Gene Franean1_0300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0300
Symbol
ID	5668724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	354886
End bp	356019
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	73%
IMG OID	641239230
Product	hypothetical protein
Protein accession	YP_001504672
Protein GI	158312164
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.262799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.348803
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGCTG AGCTGGTGGA CTGGGAACTC GCCGTAACGA CGGCGAAGAA GCTCGTCCGA 
CCAGGGCCGC AGCGAAGCCG GGCGGAGGCG GACGAGATCG TCTCGGAGCT CCGGCGCCTG 
GCGGTCGTCG CCGAGGGCCA TGTGCAGGAC TACACCCAGC TCGTCCCCGC CGGACCACCG 
ACCCCGATCG CGGTCGTCGA CCGGCCGGAG TGGGTTCGTT CCAACGTCGC CGGGCTGCGC 
GTGGCCACCA TGCCCCTGAT CGAGAAGCTC TCCGACCAGA GCCGCGGCCG GCTCGCCGCC 
GCGGTGGGCC GGCGGGTCAC CGGTGTCCAG GTCGGGTCCG CGCTCGCCTA CCTCGCGGGC 
AAGGTCCTCG GCCAGTTCGA GGTCTTCCTC CCGCCGGAGG AGTACGAGGC GGGCAGCGCC 
GCGAGCGCCC CGTCTCTGGC GAAGCCCGGC GCTCCGACCC CGGTGGGGCG GCTCAGCCTC 
GTCGCGCCGA ACATCGCCCA CGCCGAGGAG ACCCTGCGGG TGGTCCCACG CGACTTCCGG 
CTCTGGGTCT GCCTGCACGA GCAGACGCAC CGCAGCCAGT TCACCGCCGT CCCGTGGCTG 
CGCGAGCACC TCGAGTCCGA GATCGCGGCG TTCATCGGCG CGACCGACCT CGATCCCGAT 
GTCCTCGCCG ACCGGCTCCG CTCCGCCGTC ACGGCGCTGC GCAGCGCCGT GCGCGACCAC 
GGGCCGGACA CGCCGAGCGT CGTGGAGGCG TTGCAGACCC CGGCGCAACG CGCCGTCCTC 
GACCGCCTCC AGGCGCTGAT GAGCCTGCTC GAGGGGCACG CCGACCAGGT CATGGACGCG 
GTCGGCCCGC AGGTCGTGCC GACGGTGGCC GACATCCGCG GCAAGTTCGA CAACCGGCGC 
TCCGGCGGCT CGCCCATCGA CCGCTTCCTA CGTCGCCTGC TCGGGCTGGA TCTCAAGATG 
CAGCAGTACC GCCAGGGCGG GGCGTTCGTC CGCGCCGTGG TCGCCGAGGT CGGCGTGGAG 
GGCTTCAACC ACGTCTGGCA GTCGCCGCGG ACCCTGCCCA CCCGCCCTGA GCTGACCGAC 
CCGGGCGCGT GGATGCTCCG GGTGCTCGGC ACCCGCCCGT CGATGTCCGC GTGA

Protein sequence

MDAELVDWEL AVTTAKKLVR PGPQRSRAEA DEIVSELRRL AVVAEGHVQD YTQLVPAGPP 
TPIAVVDRPE WVRSNVAGLR VATMPLIEKL SDQSRGRLAA AVGRRVTGVQ VGSALAYLAG 
KVLGQFEVFL PPEEYEAGSA ASAPSLAKPG APTPVGRLSL VAPNIAHAEE TLRVVPRDFR 
LWVCLHEQTH RSQFTAVPWL REHLESEIAA FIGATDLDPD VLADRLRSAV TALRSAVRDH 
GPDTPSVVEA LQTPAQRAVL DRLQALMSLL EGHADQVMDA VGPQVVPTVA DIRGKFDNRR 
SGGSPIDRFL RRLLGLDLKM QQYRQGGAFV RAVVAEVGVE GFNHVWQSPR TLPTRPELTD 
PGAWMLRVLG TRPSMSA