Gene Franean1_0288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0288
Symbol
ID	5668712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	338215
End bp	339744
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	73%
IMG OID	641239218
Product	hypothetical protein
Protein accession	YP_001504660
Protein GI	158312152
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG GGCTCCTGGT GACGGGCACG ACACAGGCGA TCCGTGCTTC GCACGAGATC 
CTCGAACGGG CGCTGGAGCT GTCCCGCGCG GACGGCGCGA TCGTGATCGC CAGCGAGTCG 
AGCACGGTGA ACCTGCGCTG GGCGAACAAC ACGCTCACCA CGAACGGTGC CGCGCGTGAC 
CGCTCCGTGA CCATCATCAG CGTGATCGGG CGCTCGTTCG GGGTGCGCTC CACCTCGACG 
GTGGACGGGC CGGGCGTCGG GGCCGATCTG GCGGGCCTGG AGGCGCTGGT CCGCGCATCC 
GAGGCGGCCG CACGCGAATC AGACGACGCC GAGGACTACA GCGACCTGGT CGTGCCCGCG 
GCGGCGGCGG TCGGCGGCCG GTCCTTCACC GACCCGGCCG AGCGGACCAG CAGCGAGGTG 
TTCGCCTCCT TCGCCGACGA CCTGGCCGAG GCGTTCGGCG CGGCGCGGGC GGAGGGCCGG 
CGCCTGTTCG GTTTCGCCGA GCACGACCGC ACCACGACCT GGCTCGGGAC GTCGACCGGC 
CTGCGGCTGC GGCACAGCCA GCCCACCGGC TCGGTGGAGT GGAACGCGAA GAGCGCCGCC 
CCCGGTGGCT CCGTGTGGCA CGGGCAGTCC ACCCAGGACT TCACCGATGT GGACGTCGCC 
GCGACCGACG CGCGTCTGCG GGCCCGGCTG CGCTGGTGCG ACCGGTCGGT GGAGCTGCCG 
GCCGGCCGGT ACGAGACGCT TCTCCCCCCC TCCGCCGTCG CCGACCTCAT GGTCTACCTG 
TACTGGTCGG CGGCCGGGCG GGACGCCGCC GAGGGACGCA CGGTGTTCAG TCGCGCCGGC 
GGCGGGACGC GCGTGGGCGA GGCGCTCGGC CCCGCCGGCC TGCGCCTGTG GAGCGACCCC 
AGCGCGGCGG GCCTGACGAG CGCGCCGTTC GTGACGGCTG GTGCGTCCTC GGCGACCTCG 
AGTGTCTTCG ACAACGGGCT GCCGCTGGGA CCGACCGACT GGATCCGGGA CGGTCGTCTC 
AACGCGCTTG TCCAGACCCG CTCGTCGGCG CGCGCCGCGA GCCTGGCCGC CCCGGCCGCC 
GCGCCGAACA GCACCAGCAA CAGCTCCGGC AACGGCATCA GCGCCGGCGC GGCCGGCCTC 
GCCGGTCAGG GCATCGCCGT GACCCCCTTC GTCGACAACC TGCTCCTCGA CGGCGGCGGC 
ACCGCCACCC TGGACGAGAT GATCACCTCG ACGCGGCGCG GCCTGCTCCT GACCTGCCTG 
TGGTACATCC GGGAGGTCGA CCCGCAGGTC CTGCTACTCA CCGGCCTCAC CCGGGACGGC 
GTCTTTCTCA TCGAAAACGG TGAGGTCGTC GGGGCGGTCA ACAACTTCCG GTTCAACGAG 
TCGCCGGTGG ACCTGCTGGG CCGCATCGCC GAGATCGGTG CCAGCACGCG GACGATGCCG 
CGGGAATGGG CCGACTGGTT CACGCTGGCC AGAATGCCCG CGCTGCGGAT TCCGGACTTC 
AACATGAGCT CGGTGAGCCC GGCGAGCTGA

Protein sequence

MSEGLLVTGT TQAIRASHEI LERALELSRA DGAIVIASES STVNLRWANN TLTTNGAARD 
RSVTIISVIG RSFGVRSTST VDGPGVGADL AGLEALVRAS EAAARESDDA EDYSDLVVPA 
AAAVGGRSFT DPAERTSSEV FASFADDLAE AFGAARAEGR RLFGFAEHDR TTTWLGTSTG 
LRLRHSQPTG SVEWNAKSAA PGGSVWHGQS TQDFTDVDVA ATDARLRARL RWCDRSVELP 
AGRYETLLPP SAVADLMVYL YWSAAGRDAA EGRTVFSRAG GGTRVGEALG PAGLRLWSDP 
SAAGLTSAPF VTAGASSATS SVFDNGLPLG PTDWIRDGRL NALVQTRSSA RAASLAAPAA 
APNSTSNSSG NGISAGAAGL AGQGIAVTPF VDNLLLDGGG TATLDEMITS TRRGLLLTCL 
WYIREVDPQV LLLTGLTRDG VFLIENGEVV GAVNNFRFNE SPVDLLGRIA EIGASTRTMP 
REWADWFTLA RMPALRIPDF NMSSVSPAS