Gene Francci3_3632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3632
Symbol
ID	3904188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4336969
End bp	4337997
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	71%
IMG OID	637880955
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_482713
Protein GI	86742313
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.347698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTTG CGGTGATTGG CGGTGACGGG ATCGGCCCCG AGGTGGTGGC GGAGGGGTTG 
CGGGTGCTGC GCGCGGTACA TCCCAAGGTC GACACGACCG AATACGACCT GGGTGCCCGG 
CGCTGGCACG AGACCGGGGA GACGCTGCCC GACTCGGTGC TGGAGGAACT GCGCGGTCAC 
GACGCGATCC TGCTCGGGGC GGTCGGTGAT CCCGGCGTGC CCAGCGGTGT CCTCGAGCGT 
GGCCTGCTGC TGCGGCTGCG GTTCGAGTTC GACCATCACG TCAATCTCCG GCCGGTGCGG 
CTCTATCCGG GAGTCCGCTC GCCGCTGGCC GGAGATCCGG CCATCGACAT GATCGTGGTG 
CGGGAGGGCA CGGAGGGGCC GTACGCGGGC GCGGGGGGTG TGCTCCGGAA GGGGACGCCC 
CATGAGGTGG CGACCGAGGA GAGCCTCAAC ACCCGGTACG GCGTCGAGCG CGTCGTGCGC 
GACGCGTTCC GGCGGGCCGA TCGACGCGAG CGTCGCCACC TGACTCTCGT GCACAAGAAC 
AACGTGCTGA CCAAGGCCGG CGACCTGTGG TCGCGCACCG TGGCCGAGGT GGCGCCCGAG 
TTCCCCGACG TGCGCGTCGA CTACCAGCAC GTGGACGCGG CCTCGATGTT CTTCGTGACC 
GATCCGGGTC GGTTCGACGT CGTCGTGACG GACAACATGT TCGGTGACAT CCTCACCGAC 
ATCGGCGCGG CCATCACCGG CGGGATCGGC CTGGCCGCCA GTGGCAACCT CGATCCCTCC 
GGTGTCCACC CGAGCATGTT CGAGCCCGTG CACGGCAGCG CCCCGGATAT CGCCGGCAGG 
CAACTCGCCG ACCCGACGGC CACCGTCGCC TCGGTGGCGA TGCTACTCGA TCATCTCGGC 
CACGCCGAGG AGGCGGCGAA GGTCGAGGCC GCCGTCGCCT CCTCCCTGGC GGATCGTGCC 
GCCGCGGGAG CGGCCCAGCC GTCGACCCGG GAACGTGGCG AGGACCTTGC CGCGCGGGCT 
GCGGGCTGA

Protein sequence

MRLAVIGGDG IGPEVVAEGL RVLRAVHPKV DTTEYDLGAR RWHETGETLP DSVLEELRGH 
DAILLGAVGD PGVPSGVLER GLLLRLRFEF DHHVNLRPVR LYPGVRSPLA GDPAIDMIVV 
REGTEGPYAG AGGVLRKGTP HEVATEESLN TRYGVERVVR DAFRRADRRE RRHLTLVHKN 
NVLTKAGDLW SRTVAEVAPE FPDVRVDYQH VDAASMFFVT DPGRFDVVVT DNMFGDILTD 
IGAAITGGIG LAASGNLDPS GVHPSMFEPV HGSAPDIAGR QLADPTATVA SVAMLLDHLG 
HAEEAAKVEA AVASSLADRA AAGAAQPSTR ERGEDLAARA AG