Gene Francci3_2506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2506
Symbol
ID	3904884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2957493
End bp	2959817
Gene Length	2325 bp
Protein Length	774 aa
Translation table	11
GC content	66%
IMG OID	637879836
Product	hydantoinase B/oxoprolinase
Protein accession	YP_481602
Protein GI	86741202
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.615482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGTCA CGGACGACAG CGCCACGCAG GAGCAGGCCG CCGAGCAGAA CACCCTCACG 
CCCCAGGAGC GGGAGTGGGT CGACCAGTTC ATGGACGAGA CCACCCTCTT CCTCGGTCCC 
GACCCGGTGA TCATGCGTGA CCACTCCATC CAGGAACGGA CGTCGCGGGA GGAGACGGCG 
ATCGCCGCCG GTGTCGACCG GCTGGTGGTC GAGCGGATCC GCAAGCGGAT TGCCGGTGCG 
CTCGACGAGG GCTACGAGAT GTGCGAGGCG CAGGGTGCCG CGCCCGGGGC GAAGTGGGGT 
GACCTGACGA CCGCGATCTA CACCGCGGCC GGGGACGTGT CCTACCTCTC CTGCCACGGG 
GTGATCGCGT TCTCCGCGAT CCTGCACCAC CCGATCCGGT ACATCATGAA GTACTGGAAG 
GACGAGCCGA CCGTCGGTAT CCACGAGGGC GACGGATTCA TCCACAACGA CGCCCGGTTC 
GGCAACGTCC ACAACACCGA CCAGTCGATG ATCATGCCGA TCATACGTGG GGGTGAGATC 
ATCGCGTGGG TGGCGGCGAC CATCCACGAA GGCGAGAACG GCGCCTGCGA GCCGGGCGGC 
ATGCCGTCGG GCTCGGAGAC CCCGTTCGAC GACGGCCTCC GGATGAGCCC GTTCAAGATC 
GTCGAGCGTG GTCATCTGCG CCGGGACCTG CTGACCTTCC TCCAGCACTC GGTGCGCGAC 
CCCAAGCTGC AGCTGGCCGA CCTGAAGGTG AAGATCACCG CGGTACGCAA GATCATGGAG 
CGCATCGACA AGGTCATCGA CGAGGTCGGC GTCGACACGT TCGTGGCGGC CCTGCGGGTC 
ACCGTCGAGG ACGTCGACGC GGAGGTCCGC CGCCGGATCT CCGAGCTTCC CGACGGCACG 
TACTCCTTCA ACCAGTTCAT GGACTCGACG CTGAAGGAGA ACATCCTCAT CAAGATCGCC 
TGCAGGATCC ACGTCAAGGG CGACAAGATG ACCGTCGACC TGCGTGGCAC CGGACCGGAG 
ATCATCAACC GGGCGATCAA CTCTCCGCTG TGCTCGGTGA AGTCGATGAT GATGCAGGCG 
ATCCTGGCGT TCTGGTGGCC AGACCTGCCG CGCTGCACGG CGGCGATGAG CTGCATCGAG 
ATCATCTCCG ACGAGGGCAC CTGGGCCGAC GCGTCCTACG ACGCCCCGAT GGGACAGTCG 
CTGCAGGCCT CGTTCCGAGG CTTCTCGATG ATGCAGGCGC TCTACGGAAA GATGTCGTTC 
TCCACGCCGC ACAAGTACTC GAACATCGTG GCCAACTGGT TCAACCAGAT CAACACGTTC 
CTGTGGGGCG GTGTCACCCA ACACGGCGAC ATGGTCGGCA ACCTGTGTGC CGACCTCAAC 
GGCATGCCCG GGGGAGCCAA GCCCTTCCGG GACGGTGAGG ACGCCGTCTC GCCGCTCTTC 
TGCGCCATGG CCGACACGGC CGAGCAGGAG GTCATGGAGG AGGAGGTGCC CTTCATGCAG 
CTGGTGGCCA AGCGCCTGGT CCGCGACAAC ATGGGCTTCG GCAAGTTCAC CGGCGGCATG 
GGCTACGAGA TGATCGTGGC CGCCGAGGGC ACGCCGGAGT GGGGCTTCAT GACGGTGACC 
TCCGGAGCGA AGTTCTCGTC CATCTACGGC ATGTTCGGGG GCTACGGCTG CGGCACCTAC 
CCGCTGGCGA TGGTCAAGGG CACGAATGTC TACGAGCACA TTCGTCGGGA CAACAAGAAG 
TTCGACCTCT CGATCGAGAA GGTCATGAAC GAGCGTCCGT TCCCGGACGG GAAGTACTCG 
ACCTATCACA TGGGTCTGCA GTACGACCGC GCCAAGGACG GCGAGCTCTA CATGATCTCC 
CAGGGCGCCG GTGGTGGGTA CGGCGACCCG CTGGAGCGCC TGCCCGAGTC GGTGGTGCGC 
GATGCCGAGC TCGGCCGGAT CAGCCAGAAG GTCGCCGAGG AGATCTTCGG TGTCCGCTAT 
GACCCGATCA CCTTCCGGCT CGACGCCGAG GGCACCAGGC AGGCCCGCGA GCGGGTCCGC 
CAGACGCGCC TGACGCGCGG CAAGCCCTAC GCGGAGTTCG TCAAGGATTT CGTCACCGAG 
GAGCCGCCGA AGGACCTCCT CTACTACGGC TCCTGGGGCG ACGACACCAA GGACCTCACC 
GCCACGGTGT TCACCATCGA CGGTCCCCAG CGGGTCAAGG CGCCGCTGAA GGAACTGCCG 
ATCATCGTGA TTCCGGACCG CCGGGAGCTG AAGATCGCGG CGCTGGAGGC GCGCGTGCGG 
GAGCTGGAGG ACAGGCACGG CGAGGACGTC AAGCGTCTCG CCTGA

Protein sequence

MTVTDDSATQ EQAAEQNTLT PQEREWVDQF MDETTLFLGP DPVIMRDHSI QERTSREETA 
IAAGVDRLVV ERIRKRIAGA LDEGYEMCEA QGAAPGAKWG DLTTAIYTAA GDVSYLSCHG 
VIAFSAILHH PIRYIMKYWK DEPTVGIHEG DGFIHNDARF GNVHNTDQSM IMPIIRGGEI 
IAWVAATIHE GENGACEPGG MPSGSETPFD DGLRMSPFKI VERGHLRRDL LTFLQHSVRD 
PKLQLADLKV KITAVRKIME RIDKVIDEVG VDTFVAALRV TVEDVDAEVR RRISELPDGT 
YSFNQFMDST LKENILIKIA CRIHVKGDKM TVDLRGTGPE IINRAINSPL CSVKSMMMQA 
ILAFWWPDLP RCTAAMSCIE IISDEGTWAD ASYDAPMGQS LQASFRGFSM MQALYGKMSF 
STPHKYSNIV ANWFNQINTF LWGGVTQHGD MVGNLCADLN GMPGGAKPFR DGEDAVSPLF 
CAMADTAEQE VMEEEVPFMQ LVAKRLVRDN MGFGKFTGGM GYEMIVAAEG TPEWGFMTVT 
SGAKFSSIYG MFGGYGCGTY PLAMVKGTNV YEHIRRDNKK FDLSIEKVMN ERPFPDGKYS 
TYHMGLQYDR AKDGELYMIS QGAGGGYGDP LERLPESVVR DAELGRISQK VAEEIFGVRY 
DPITFRLDAE GTRQARERVR QTRLTRGKPY AEFVKDFVTE EPPKDLLYYG SWGDDTKDLT 
ATVFTIDGPQ RVKAPLKELP IIVIPDRREL KIAALEARVR ELEDRHGEDV KRLA