Gene Franean1_2679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2679
Symbol
ID	5671070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3169382
End bp	3170596
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	641241591
Product	amidohydrolase 2
Protein accession	YP_001507011
Protein GI	158314503
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCA CATCGCAGCC CGACGTCGAG ATCGATCCCC GCCTCGGATA TGCGGTGTTC 
GATGCCGACA ACCACTACTA CGAAGCCGTG GACGCGCTGA CGCGCCACCT TCCGAAAGAG 
TTCGCCAACC GCGGCGCGCG ATGGATCGAC CTGAACGGAC GCAAGCGCCT GATGCTCGGC 
GCTAAGCTTT TCGAACTCAT TCCGAACCCG ACCTTCGACC CGATCGGGAA GCCGGGCGCG 
CTCTATCAGT ACTTCAAGGG CGTCAACGCC GATGGTGCCG ACGTGCGAAC ACTGGTGGGT 
GATCTGGAGA AGATCCGGCC CGAGTACCGG GACCGGGACG TGCGTCTAGC GGTCATGAAC 
GACCAGGGGG TCGGCGCGGC CTGGTTCTTC CCGACGCTGT CCGTCGGTCT CGAGGTGGCG 
TTCCAACCCG ACATCCGGGC CGCTCTGGCG ACCTTCTCGG CGTTCAACCG GTGGCTTGAC 
GACGACTGGG GCTTCGCCTA CCAGGACCGG ATCTTCTCCG CTCCGTACCT TTCGCTCTCC 
GACGTCGACT GGGCCGTGCG GGAGCTGGAG TGGTGCATCA GCCGCGGCGC TCGGGTCATC 
ACCATGCGTA ACGGCACTGT GTACACGGCC GAGGGGACGG CGTCTCCCGC CGACGAGCGG 
TTCGACCCGT TCTGGGCGCG GGTCGAGGAG GCGGGCATCG TCATGGCCCC GCACGCCGGT 
GACGACGGCT ACGACTTCCT CGCGGACATG TGGGAGTCCA GCACGTCGTG GCGGATGCTG 
TTCAACTCCC CGCTGAAGAA GGCGGTCGCC TCGCAGCGCG CGGTGCCGGA CTTCTACGCG 
GCGATCATCT GTCATCGGCT GTTCGAACGG TTCCCAGGCC TGCGTTTCGC GTCCATCGAG 
AACGGGGGTG CGTGGGTGGC GCCGCTGCTG GCCCGTCTCC ACAAGGGCCA TACCCAAACG 
GCGGGCTGGT ACAAGATCGA TCCTGTCGAG CAGTTCCGGG AGCACGTGTG GATCACTCCC 
TTCTGGGAGG ACAACGTGCA GGAGATCGCC CGCACCATGC CCGCCGGGCG TCTGCTGTTC 
GGCAGCGACT GGCCACATCT CGAGGGCGTC GCGCAGCCGC TGGACTTCTT GACGGCCCTC 
GAGGGCTTCG ACGCCGCCGA CCGGCGGCGC ATCATGCGCG ACAACGCCGC GGCGCTGACC 
GCTGCCCCAC GCTGA

Protein sequence

MTTTSQPDVE IDPRLGYAVF DADNHYYEAV DALTRHLPKE FANRGARWID LNGRKRLMLG 
AKLFELIPNP TFDPIGKPGA LYQYFKGVNA DGADVRTLVG DLEKIRPEYR DRDVRLAVMN 
DQGVGAAWFF PTLSVGLEVA FQPDIRAALA TFSAFNRWLD DDWGFAYQDR IFSAPYLSLS 
DVDWAVRELE WCISRGARVI TMRNGTVYTA EGTASPADER FDPFWARVEE AGIVMAPHAG 
DDGYDFLADM WESSTSWRML FNSPLKKAVA SQRAVPDFYA AIICHRLFER FPGLRFASIE 
NGGAWVAPLL ARLHKGHTQT AGWYKIDPVE QFREHVWITP FWEDNVQEIA RTMPAGRLLF 
GSDWPHLEGV AQPLDFLTAL EGFDAADRRR IMRDNAAALT AAPR