Gene Franean1_6005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6005
Symbol
ID	5674326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7323946
End bp	7324968
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	77%
IMG OID	641244853
Product	metalloendopeptidase glycoprotease family
Protein accession	YP_001510255
Protein GI	158317747
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0902481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.147252
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGACAC CGGCCCGACC GCTGGTGCTG GGCATCGAGA CCTCGTGCGA CGAGACCGGC 
GTCGGCCTCG TCCGTGGCGG CGAGTTGCTC GCCGACGCGC TCGCCTCCTC GGTCGACGAG 
CACGCCCGGT ACGGCGGCGT GGTGCCCGAG ATCGCCGCGC GGGCGCACCT GGAGGCGATG 
GTCCCGACGA TCGAGCTGGC GTTGGACCGC GCCGGCCTGC GCCCCCGGGA CGTCGACGCC 
GTCGCGGTGA CATCCGGCCC GGGGCTGGCC GGCGCGCTGC TGGTCGGGGT CGCCGCGGCG 
AAGGCGTACG CGCTGGCGCT GGGTGTCCCG CTGCACGGGG TGCACCATCT CGCCGCGCAC 
GTCGCCGTCG ACACGCTTGA GCACGGCCCG CTGCCGCGCC CGGCGGTGGC GCTGCTGGTC 
TCTGGTGGGC ACAGCTCGTT GCTGCTGGTC CCCGATCTCG CGGCCGAGCC GGTCGAGTCG 
CTGGGGGCCA CGGTGGACGA CGCCGCGGGG GAGGCCTACG ACAAGGTCGC CCGGTTGCTC 
GGCATGCCGT TCCCGGGTGG CCCGCCGATC GACGCGGCGG CCCGCGAGGG CAGCCCGCGC 
ATCCCGTTCC CGCGCGCCAA GGCGGGGGAC GGCACGTTCG ACTTCTCCTT CTCCGGGCTC 
AAGACCGCGG TCGCCCGCTG GGTGGAGGCC CGGCGGCGGG CCGGCGAGCC CGTGCCGGTC 
GCGGATGTCG CGGCGTCGTT CCAGGAGGCC GTGGCGGACG TGCTCACCGC GAAGGCGGTC 
GCGGCCTGCC GGGCGCACGG TGTGGACACC CTGGTGGTCG GGGGCGGTGT CGCGGCCAAC 
AGCCGGCTGC GCGTGCTCGC CGCGCTGCGC TGCGAGGCGG CGGGCATCAC GCTGCGGATC 
CCGCGGCCGG GGCTGTGCAC CGACAACGGC GCGATGGTCG CGGCGCTCGG GTCGCTGCGG 
GTCGAGGCCG GCGTCGAGCC CTCGCCGCTG GACCTTCCCG CGTCCTCCAC GCTCGCCCTC 
TGA

Protein sequence

MRTPARPLVL GIETSCDETG VGLVRGGELL ADALASSVDE HARYGGVVPE IAARAHLEAM 
VPTIELALDR AGLRPRDVDA VAVTSGPGLA GALLVGVAAA KAYALALGVP LHGVHHLAAH 
VAVDTLEHGP LPRPAVALLV SGGHSSLLLV PDLAAEPVES LGATVDDAAG EAYDKVARLL 
GMPFPGGPPI DAAAREGSPR IPFPRAKAGD GTFDFSFSGL KTAVARWVEA RRRAGEPVPV 
ADVAASFQEA VADVLTAKAV AACRAHGVDT LVVGGGVAAN SRLRVLAALR CEAAGITLRI 
PRPGLCTDNG AMVAALGSLR VEAGVEPSPL DLPASSTLAL