Gene Franean1_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1564
Symbol
ID	5669967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1870625
End bp	1871800
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	66%
IMG OID	641240483
Product	amidohydrolase 2
Protein accession	YP_001505909
Protein GI	158313401
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.302749
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.45285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCAAGT TGGTCGAAGG TTTACGAGTA GTTGACGCCG ACTCCCACAT GACCGAGCGC 
CATGACCTGT TCACCGAGCG GGCCCCGAAG GGCTACGAGG ACAAGGTCCC GCACGTCCAG 
CGGATCAACG GCCAGGACAT GTGGGTCGTC GCCGGCAAGT CCTTCGGCCG CGCGGGCTCC 
GGTGGAACGA TCGACCACGA CGGCAAGAAG CACCCGTGGA AGGACTCTCA GGGCGGGTCC 
TGGGGCATCG AGAGCGTCCA CCCCGCGGCG TGGGACGCCG GCCGGCGGAT CACCCTGATG 
GACGAGCTCG GCATCGACAC CCAGGTGGTC TACCCGAACG CCATCGGCAT CGGCGGCCAG 
AACCTGTTCA ACGCGGTCGA CGACCCCACG GTCGTCCGGC TCTGCGTGGA GCTCTACAAC 
GACGCGATGG CGGAGGTCCA GGCGGAGTCG GGCAACCGGC TGCTCCCCAT GCCGATCATG 
CCAGCGTGGG ACATCCAGGG CTGTGTGCGC GAGGCGCAGC GCTGCGCGGA GATGGGCTAC 
CGCGGGGTCA ACATGACCGC CGACCCGCAG GACTCCGGCT CACCGGACCT GGGCGACCCG 
GCGTGGGACC CGTTCTGGGA GGTCTGTGCC GGGCTGAACC TGCCGGTGCA CTTCCACATC 
GGCGCCAGCC AGACCTCGCT GTCCTACTTC GGCACGACCT ACTGGCCGAG CCAGGACGAC 
TACGTGAAGC CGGCGATCGG CGGTGCGTCG CTGTTCCAGA ACAACTCCCG GCTGCTGCTC 
AACAGCTGCT ACTCGGGAAT GTTCGACCGC CATCCGAACC TGAAGATGGT CTCGGTCGAG 
AGCGGCATCG GCTGGATCCC CTTCATGCTC GAGGCGATGG ACTACGAGCT CGAGGAGAAC 
GCGCCGGAGT ACTTCCGCAA GCTGCAGAAG CTGCCGTCGG AATACTTCGC GTCGAACTGG 
TACGCGACCT TCTGGTTCGA GAAGGGCCGC GGCGACCTCC AGCATCTCGT CGACACCGTC 
GGCGAGGACA ACATCATGTT CGAGACGGAC TTCCCGCACC CGACGAGCCT GCACCCGAAC 
CCGCTCGAGA TGGTCACCGA GCAGGTCGGC GCGCTGCGCC CGGAGACGCA GCGCAAGATC 
ATGGGTGAGA ACGCCACCAA GCTCTACCGC GTCTGA

Protein sequence

MVKLVEGLRV VDADSHMTER HDLFTERAPK GYEDKVPHVQ RINGQDMWVV AGKSFGRAGS 
GGTIDHDGKK HPWKDSQGGS WGIESVHPAA WDAGRRITLM DELGIDTQVV YPNAIGIGGQ 
NLFNAVDDPT VVRLCVELYN DAMAEVQAES GNRLLPMPIM PAWDIQGCVR EAQRCAEMGY 
RGVNMTADPQ DSGSPDLGDP AWDPFWEVCA GLNLPVHFHI GASQTSLSYF GTTYWPSQDD 
YVKPAIGGAS LFQNNSRLLL NSCYSGMFDR HPNLKMVSVE SGIGWIPFML EAMDYELEEN 
APEYFRKLQK LPSEYFASNW YATFWFEKGR GDLQHLVDTV GEDNIMFETD FPHPTSLHPN 
PLEMVTEQVG ALRPETQRKI MGENATKLYR V