Gene Francci3_2516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2516
Symbol
ID	3904660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2972892
End bp	2973929
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	61%
IMG OID	637879846
Product	amidohydrolase 2
Protein accession	YP_481612
Protein GI	86741212
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.125947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGTCA AGGACAATGA GCGATACTTC ATCGTGGATT CCCACCTGCA CTTCTGGGAT 
GGGAGCCCGG AAAACCAGGC GAACCGCTAC GGCAAAGGTT TCATCGACTG CTTCTACGAT 
TACCATGTGA ATCTGAGCCC GCAGGAGTAC CTCTGGCCGC GGGAAAAGTT CCAGAAGTAC 
TCTGCGGAAG TCATGGTGAA GGACCTGTTC GAGGACGGTT ACGTCGACAA GGGGATCTTC 
CAGCCCACTT ATCTGACGGA CTTCTACCGG AATGGTTTCA ACACCACCGA GCAGGACGGC 
GCGCTCGCCG AGCGGTACCC CGGCAAGTTC ATCGTGAACG GCGCCTTCGA CCCGCGTGAC 
GGCGAACTGG GCCTGTCGAA GCTGGCGGAC CTGGCGGCAC GCTGGAACCT CAAGGGTGTG 
AAGCTCTACA CGGCGGAGTG GAAGGGCGAG TCCAAGGGCT ACAAGCTGAC CGACCCGTGG 
GTCTACCGGT ATCTGGAGAA GTGCCAGGAA CTCGGCATCC GCAACATCCA CATCCACAAG 
GGCCCGACGA TCTACCCGCT GAACCGGGAC GCGTTCGATG TCGCCGACGT CGATGATGTG 
GCCACCGAAT TCCCCGAGCT GCGGTTCATC ATCGAACACG TCGGACTGCC CCGGTTGGAG 
GACTTCTGTT GGATCGCCAC GCAGGAGCCC AATGTCTACG GTGGGCTCGC GGTGGCCATG 
CCGTTCATCC ACAGCCGGCC GCGCTACTTC GCGCAGATCA TCGGTGAGCT CCTCTACTGG 
CTCGACGAGA ACCGGCTGAC CTTCTCGAGT GACTACGCGA TCTGGCACCC CAAGTGGCTG 
GTCGAGAAGT TCGTCGACTT CCAGATCCCG GCGGACATGC AGGCCGAGTA CGGCGTGCTC 
ACCCCCGACA TCAAGCGCAA AATTCTCGGT CTCAACGCGG CCGCGCTCTA CGACATCGAG 
GTACCGGCCG AGGTTAGCGG GGCGGGCAGC GGTTCTCCGG CGTCGACGCC TCTCGTGGGC 
GCAGGGCAGT CCGTATGA

Protein sequence

MYVKDNERYF IVDSHLHFWD GSPENQANRY GKGFIDCFYD YHVNLSPQEY LWPREKFQKY 
SAEVMVKDLF EDGYVDKGIF QPTYLTDFYR NGFNTTEQDG ALAERYPGKF IVNGAFDPRD 
GELGLSKLAD LAARWNLKGV KLYTAEWKGE SKGYKLTDPW VYRYLEKCQE LGIRNIHIHK 
GPTIYPLNRD AFDVADVDDV ATEFPELRFI IEHVGLPRLE DFCWIATQEP NVYGGLAVAM 
PFIHSRPRYF AQIIGELLYW LDENRLTFSS DYAIWHPKWL VEKFVDFQIP ADMQAEYGVL 
TPDIKRKILG LNAAALYDIE VPAEVSGAGS GSPASTPLVG AGQSV