Gene Franean1_1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1098
Symbol
ID	5669512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1311667
End bp	1312695
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	74%
IMG OID	641240030
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001505460
Protein GI	158312952
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.51179
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTTG CGGTCATTGG TGGCGACGGA ATCGGCCCGG AAGTGGTCGC GGAGGGGCTG 
CGCGTGCTAC GCGCCGTGCA TCCCAAAGTG GAGACCACCG ACTACGACCT GGGCGCGCGG 
CGCTGGCACG AGACCGGCGA GACCCTGCCC GACAGCGTCC TGGCGGAGCT GCGCGGGCAC 
GACGCGATCC TGCTCGGCGC TGTCGGCGAC CCCGGGGTAC CCAGCGGCGT CCTGGAACGC 
GGGCTGCTGC TGCGGCTGCG GTTCGAGCTG GACCACCACG TCAACCTCCG GCCGGTCCGG 
CTGTACCCCG GAGTGACCTC ACCGCTCGCC GGTGACCCCG CCATCGACAT GATCGTGGTG 
CGGGAGGGGA CGGAGGGCCC CTACGCCGGC GCCGGCGGCA CTCTGCGGCG CGGGACGCCG 
CAGGAGGTGG CGACCGAGGA GAGCCTGAAC ACGCGCTTCG GGGTCGAGCG GGTCGTGCGC 
GACGCCTTCG CGCGGGCGAG CCGGCGTCCC CGCGCCCACC TCACCCTGGT ACACAAGACC 
AACGTGCTCA CCAAGGCGGG CGACCTGTGG GCCCGCACGG TCGCCGAGGT CGGCGCCGAG 
TTCCCCGCCG TCAGCGTCGA CTACCAGCAC GTGGACGCCG CGTCGATGTT CTTCGTGACC 
GACCCGGCCC GGTTCGACGT GGTGGTCACC GACAACATGT TCGGCGACAT CCTGACCGAC 
ATCGGCGCCG CGATCACCGG CGGCATCGGG CTCGCCGCCA GCGGGAACCT CGACCCCTCG 
GGCGCGAACC CGAGCATGTT CGAGCCGGTC CACGGCAGCG CTCCCGACAT CGCCGGCCAG 
GGGCTGGCGG ACCCGACCGC GACGGTCGCC TCGGTCGCGA TGCTGCTGGA CCACCTCGGC 
CACGCCGACG AGGCGGCCCG GGTGGAGGGC GCGGTGGCCG CGTCGCTGGC CGCCCGCGCC 
GCGGCCGGCG GTGCCCGCCG CTCCACCCGC GAGATCGGCG ACGACCTGGC CACCCGCGCC 
GCGGGCTGA

Protein sequence

MRLAVIGGDG IGPEVVAEGL RVLRAVHPKV ETTDYDLGAR RWHETGETLP DSVLAELRGH 
DAILLGAVGD PGVPSGVLER GLLLRLRFEL DHHVNLRPVR LYPGVTSPLA GDPAIDMIVV 
REGTEGPYAG AGGTLRRGTP QEVATEESLN TRFGVERVVR DAFARASRRP RAHLTLVHKT 
NVLTKAGDLW ARTVAEVGAE FPAVSVDYQH VDAASMFFVT DPARFDVVVT DNMFGDILTD 
IGAAITGGIG LAASGNLDPS GANPSMFEPV HGSAPDIAGQ GLADPTATVA SVAMLLDHLG 
HADEAARVEG AVAASLAARA AAGGARRSTR EIGDDLATRA AG