Gene Franean1_4239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4239
Symbol
ID	5672594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5046789
End bp	5048033
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	76%
IMG OID	641243112
Product	amidohydrolase
Protein accession	YP_001508529
Protein GI	158316021
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.943042
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCA CGTCTGCCTC ACCCACCGCG CGCACCGGGC AGGCCGGGCC CGCGATCGAG 
TCCGTGCTGG AGAGCATCTC GGCCGCGCTG GCCGTGCTGC GGCCCCGGAT GGACGCGGTG 
AGCCTGGCCA TCCACGCCCG GCCGGAGCTG AAGTTCGCCG AGTTTCACGC CCGGGACGTG 
CTGACCGGCT GGCTCGGGGA GTCCGGTTTC ACCGTCCGGG TGCCGGCGGG CGGCCTGGAC 
ACCGCCTTCG TGGCCGTGCA CGAGGGGGCG GAGCCCGGCC CGTGCGTCGC CGTCCTCGCA 
GAGTACGACG CGCTGCCTGG TGTCGGGCAC GGCTGCGGGC ACAACCTCAT CGCGGCCGGG 
GGTGCGGGCG CGGCGATCGC GGCCGTCCGC GCGCTGCCCG CCCACCCCGG CACTATCGCC 
GTCATCGGCA CGCCCGGTGA GGAGATGGGC GGCGCGGGCA AGATCCGGCT CGCCGAGGCC 
GGGGTCTTCG ACGGCGTCGA CGCGGCGGTG ATGTTCCATC CCGGCGACCG GTCGCTGACC 
GGCCGGCCCG GGCTGGCCGC GGCCCACCTG CGGGTCGCGT TCGCGGGGAC GAGCGCGCAC 
GCGGCCCTCT CGCCCTGGTC GGGGCGCAGC GCGCTGGCGG GAGCCCAGCT GTTCCTCAAC 
GCACTCGACA CGATGCGCCA GTTCGTCCCG CCGAGCGCCC GGCTGCACGG CATCATCTCG 
GACGGCGGCC AGGCCCCGAA CGTCGTCCCG GCCCACGCCG CGGTGGACCT GTACGTCCGG 
GACGGCACGG CAGCCTCGGT CGAGGAACTG GTCGAGCGGG TCCGCGCGGC GGCCGCGGGC 
GCGGCGCTCG CCACCGGGAC GGCGGCGGAG GTCACCGAGA CCGGCCCGCT GTATGCGGAG 
CGCCGCGACA ACACGGTGCT CGCCGAGCGG TTCGCGGCGG CGGTGCGCGC GCTGGGTGTG 
GACATCGCGC CCGGTGACCC GCGCGGCCCC GCCGGCTCCT CCGACATCGG CAACCTCTCC 
CAGCTGCTGC CGGTCATCCA CCCGTACATC CAGATCGCCG AGGTCGGTAC GCCCGGTCAC 
TCCGACGCAC TGCGCGAGGC GGCGGCCACG GCGTTCGCCC ACGACCGCAC CCAGGTCGCG 
GCGGCAGGGC TGGCCTGGGT GGTCACCGGC CTGCTCACCG AGCCGGGCCT GCTGGCGGCG 
GCACGGGCGG AGTTCACGAC GGTGTCCACG GATGGCACGG ACTGA

Protein sequence

MPATSASPTA RTGQAGPAIE SVLESISAAL AVLRPRMDAV SLAIHARPEL KFAEFHARDV 
LTGWLGESGF TVRVPAGGLD TAFVAVHEGA EPGPCVAVLA EYDALPGVGH GCGHNLIAAG 
GAGAAIAAVR ALPAHPGTIA VIGTPGEEMG GAGKIRLAEA GVFDGVDAAV MFHPGDRSLT 
GRPGLAAAHL RVAFAGTSAH AALSPWSGRS ALAGAQLFLN ALDTMRQFVP PSARLHGIIS 
DGGQAPNVVP AHAAVDLYVR DGTAASVEEL VERVRAAAAG AALATGTAAE VTETGPLYAE 
RRDNTVLAER FAAAVRALGV DIAPGDPRGP AGSSDIGNLS QLLPVIHPYI QIAEVGTPGH 
SDALREAAAT AFAHDRTQVA AAGLAWVVTG LLTEPGLLAA ARAEFTTVST DGTD