Gene Franean1_3134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3134
Symbol
ID	5671512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3688413
End bp	3689612
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	641242031
Product	amidohydrolase
Protein accession	YP_001507451
Protein GI	158314943
COG category	[R] General function prediction only
COG ID	[COG3964] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCA AGACTCACAA CACGGACAAG TCGGTGCGCT ACGACCTCGT CCTACGCGGC 
GGACGGGTGT TCGACACCAC AATCGCGCCG GCCCCGACCG TCTTGGACAT CGCCATCACC 
GACGGACGGG TGGCCACCGT GGCGCCGCAC GTCGACGGTG TGGGAACGCG GGAGATCGAC 
TGTACCGATC GCGTTGTGAC GCCGGGGCTG CTGGACGTGC ACGTCCACTG CTTCGAGGGA 
ATGGCCATGA CCATTGGCAT GTCGTCCTAC GACGCGACCC TGCGTCGTGG CGTGGTCGGT 
TGTGTCGACA CGGGAACGTC AGGAGCCTCC AACTTCCGTG GCTTCCGCCG CTTCGCGGTG 
GGCGACAACG AGTTCCGCGT ACTGGCGTTC CTCAACGTCT CGGTGCTCGG AGTGACGGAC 
AAGCGGCACG GCGAGTTACA GGACATCTCG GTCATCCATG TGGACGACGC GGTGAACGCC 
GCCAAGGCGA ACCCTTCGAT CATCCGCGGC TTCAAGGTGC GGCTGTCCCG GAACATCGCG 
TTGGAGCCGG CGAAGTCTCT GGACCTGGCC CGCGAGATCG CCGGCCTGGC GGGCCTGCCA 
CTGATGGTCC ACATCAGCAA GACGGACATC AGCACCGACG ACATCCTGGC GCGGCTTGCC 
CCCGGAGACG TCGTCACCCA CGCCTTCACC GGGCTCGAGG GAGGCATTGT CGAGAACGGC 
TCGGTGCGAC CCGCGGCCTG GGAGGCCCGT GAACGGGGCG TGCTGTTCGA CATCGGTCAC 
GGCCGCACCC AGTTCGACCA CGGGGTGGCC CGTATCGCGC TCGACGAAGG CTTCGTCCCC 
GATTTCCTGG GTTCGGACCT CAGCAACGGC AACCAGTTCG GTCCGGCCTT CGATCTCCCG 
ACCGTCATGG CCAAGATGGT CACCCTGGGG ATGCCGATTC AGGACGTGGT CGCGGCAACG 
ACGCTCCGCG CCGCTGAGTT CCTCGGGCTG CGGGACGAGG GCTACGGCGC GATCACGGTG 
GGCAGGCCGG CGTTCGTGAC CGTCATGGAG CATCTCGACC ACGTGGACTC GCTGCCGGAC 
GCCTCTGGGG CGGAGCTCGA GGTCAGGCGA CTGGAGCCGC TGTTCGCCGT CAACAAGGGT 
GTCGTCCACG ACTCCGATCC GTGGCGGGGC GGGCAGCCCG AGCCGCCGGC GGAGTGGTGA

Protein sequence

MTTKTHNTDK SVRYDLVLRG GRVFDTTIAP APTVLDIAIT DGRVATVAPH VDGVGTREID 
CTDRVVTPGL LDVHVHCFEG MAMTIGMSSY DATLRRGVVG CVDTGTSGAS NFRGFRRFAV 
GDNEFRVLAF LNVSVLGVTD KRHGELQDIS VIHVDDAVNA AKANPSIIRG FKVRLSRNIA 
LEPAKSLDLA REIAGLAGLP LMVHISKTDI STDDILARLA PGDVVTHAFT GLEGGIVENG 
SVRPAAWEAR ERGVLFDIGH GRTQFDHGVA RIALDEGFVP DFLGSDLSNG NQFGPAFDLP 
TVMAKMVTLG MPIQDVVAAT TLRAAEFLGL RDEGYGAITV GRPAFVTVME HLDHVDSLPD 
ASGAELEVRR LEPLFAVNKG VVHDSDPWRG GQPEPPAEW