Gene Franean1_6836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6836
Symbol
ID	5675149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8332066
End bp	8333265
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	70%
IMG OID	641245685
Product	amidohydrolase 2
Protein accession	YP_001511076
Protein GI	158318568
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0916141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACTACC AGCTGATCGA TGCCGATGGC CACTACTACG AGCCCGACGA CTGCTTCTCC 
CGGCATATCG AGGCCGGTTT CAAGGAGCAC ACCGTACGGG TCGAGCGCGG GGCCGACGGC 
CTGGGCCGGG TCTATCTGGG CGACCGCCGC ACATTCATGA GCGTGATGCC CGGGGACTAC 
GCGTCCGCCC CCGGCGCGCT GCAGGGGCTG TTCGTCGGCG AGGTGGCGGA CGGCTTCACC 
CACCGCGAGG TCCTGAACGC GAAGGACCAC CCCGCGTTCA TCGAACGGCC CGCGCGGCTG 
GACCTGATGG ACGACCAGGG TGTCGAGGCG ACCATCATGC TGCCCACCCT CGGCGTGGCC 
GTCGAGCAGG ACATGGCGGA CGACGTCGAG CTGACCTACG CCAGCCTGCG CGCGTTCAAC 
CGGTGGCTCG AGGAGGACTG GGGCTACGCC GAGCAGGACC GGATCTTCGC CGTTCCGATG 
CTCTCCCTGC TCGACATCGA CCACGCCGTG GCCGAGCTGA AGCGGGTGCT GGACGCCGAC 
GCGCGCCTGG TGCACCTGCG CCCCGGGCCG ATCGGCGGCC GCTCCCCCGC GCACCCCGAC 
TTCGACCGGT TCTGGGCGAT GGCGGCCGAG GCCGGGGTCG GGGTCGTGTT CCACGTCTCC 
AACAGCGGTT ACAACGCGGC GTACGGCCAG CTCTGGTCCG AGGACGCGGG CAACCCGTCG 
CACCTGCAGT CGCCGCTGCA GTGGGCGCTG TGCAACACCG AGCGGCCGAT CGTCGACACG 
CTCAGCGCGC TCGCCCTGCA CAACCTCTTC GGCCGACACC CCAACATCAA GATCATCTCG 
ATCGAGAACG GCAGCAACTG GGTGCGACCG CTGCTGAAGA CGGTCGACAA GGCCGCCGCG 
CTCGGCCGGC GCGGCCCGAT GATCGGCGGC ACGCTCTCGG CGAAGCCCAG CGAGATGCTC 
GCCGAGCACC TGTGGGTCTG CCCGTTCCCC GAGGACGACG TGCACGACCT CATCAGCGTG 
CTCGGCCCGG ACCAGGTCCT CTTCGGTTCG GACTACCCGC ACCCCGAGGG GCTCCGCCAG 
CCCATGGACT ACGTCGAGCG CCTCGACGAC TGCGACCCGG TCACGCGGCG CAAGGTGCTG 
CGCAGCAACA CCGCCGACCT GCTCCGGATC CCCGACAAGG AGACCGCCAA GTCCGCGTAG

Protein sequence

MDYQLIDADG HYYEPDDCFS RHIEAGFKEH TVRVERGADG LGRVYLGDRR TFMSVMPGDY 
ASAPGALQGL FVGEVADGFT HREVLNAKDH PAFIERPARL DLMDDQGVEA TIMLPTLGVA 
VEQDMADDVE LTYASLRAFN RWLEEDWGYA EQDRIFAVPM LSLLDIDHAV AELKRVLDAD 
ARLVHLRPGP IGGRSPAHPD FDRFWAMAAE AGVGVVFHVS NSGYNAAYGQ LWSEDAGNPS 
HLQSPLQWAL CNTERPIVDT LSALALHNLF GRHPNIKIIS IENGSNWVRP LLKTVDKAAA 
LGRRGPMIGG TLSAKPSEML AEHLWVCPFP EDDVHDLISV LGPDQVLFGS DYPHPEGLRQ 
PMDYVERLDD CDPVTRRKVL RSNTADLLRI PDKETAKSA