Gene Franean1_4590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4590
Symbol
ID	5675740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5472063
End bp	5473235
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	68%
IMG OID	641243451
Product	amidohydrolase 2
Protein accession	YP_001508867
Protein GI	158316359
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.236617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTCC AGGACTACAT GCAGATCATT TCGGTCGACG ATCACCTCAT CGAACACCCG 
CGGGTCTTCG CCGACCGGCT CCCGCGCAAG TTCCTGGACG CGGGCCCGCG CATCGTCGAG 
GACGAGCAGC GCCGGCACGT GTGGCATATG GAGGACCAGG TCTTCCCGTA CATCGGGCTG 
AACGCGGTCG CCGGCAAGAC GCCCGAGGAG TTCGGGATGG AGCCGCTGCG CTTCGACGAC 
ATGATCCCGG GCTGCTACGA CCCGGTCGAG CGGGTCAAGG ACATGGACCT CGACGGGATC 
CAGGCCGCCT GCTGCTTCCC GTCGTTCCCC GGCTTCGGTG GCCGGGTGTT CATGCGGGCC 
AAGGATCCTG AGCTGGGGCT GGCCTGCGTG CGGGCCTGGA ACGACTTCAG CATCGACGAG 
TGGTCGGCGT CGGCGCCCGA GCGGTTCGTG CCGCTGGCCC TGCTCCCGCT GTGGGACCTC 
GACCAGGCGG TGGCCGAACT ACGCCGGGTC GCGGCCAAGG GTGCCCGTAC CGTCTCGTTT 
CCCGACAGCC CGGTCCCGCT CGGGCTGCCG TCGTTCCACG ACGACCACTG GGGTCCGCTG 
TGGGACGTCC TCGAGGAGAC CGGGATCCCG GTGAGTCTGC ATTTCGGCTC GGGCAGCTTC 
GTACCCGGCT TCAACTTCTC GGCCGCCGCG CTCTCGCCCA ACCCGCCCGC GCCCGGCCAG 
GCGCCCCCCG CGACGTCGTT CGCCCTCTAC GCGACCAACC TGATGTGGTC GACCGTGGAC 
CTGCTGTTCT CCGGGCAGCT ACAGAAGCAC CCGGGCCTGA AGTTCATGCT CTCCGAGGGC 
GGCATCGGCT GGCTCCCCTA CATCGCCGAG CGGGCCGACT GGGTCTGGGG CCGCCACCGT 
TACTACCAGC CCATCGACTT CGACACCCGC CCCAGCGAGC TGCTCCGCAA GCACTTCTGG 
GGCTGCTACA TCGACGACCG GTTCGGGCTG ACCAACCGGC ACGCGATCGG TGTCGACCGG 
ATCTGCGTCG AGATCGACTA CCCCCACTCG GACTCCATGT GGCCGAACAG CCGCAAGGTG 
ATTGCCGAGT CACTCCTCGA CGTGCCCGAC GACGAGGCCC ACAAGATCGT TGAGCTCAAC 
GCCCGTGACG TCTTCAACTT CCCGCGCTCC TGA

Protein sequence

MPLQDYMQII SVDDHLIEHP RVFADRLPRK FLDAGPRIVE DEQRRHVWHM EDQVFPYIGL 
NAVAGKTPEE FGMEPLRFDD MIPGCYDPVE RVKDMDLDGI QAACCFPSFP GFGGRVFMRA 
KDPELGLACV RAWNDFSIDE WSASAPERFV PLALLPLWDL DQAVAELRRV AAKGARTVSF 
PDSPVPLGLP SFHDDHWGPL WDVLEETGIP VSLHFGSGSF VPGFNFSAAA LSPNPPAPGQ 
APPATSFALY ATNLMWSTVD LLFSGQLQKH PGLKFMLSEG GIGWLPYIAE RADWVWGRHR 
YYQPIDFDTR PSELLRKHFW GCYIDDRFGL TNRHAIGVDR ICVEIDYPHS DSMWPNSRKV 
IAESLLDVPD DEAHKIVELN ARDVFNFPRS