Gene Franean1_1113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1113
Symbol
ID	5669526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1330711
End bp	1332108
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	73%
IMG OID	641240045
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001505473
Protein GI	158312965
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.681996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.828695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGCA CACTCGCGGA GAAGGTCTGG GACGCACACG TCGTCCGCCG CGCGGACGGA 
GAGCCCGACC TGCTCTACAT CGATCTGCAC CTCGTCCACG AGGTCACCTC GCCGCAGGCG 
TTCGAGGCGC TGCGGCTGGC CGGGCGCCCG GTCCGCCGTC CCGACCTGAC GCTGGCGACC 
GAGGACCACA ACGTCCCGAC GACCGACACG CTGCTGCCGA TCGCCGACCC GGTCTCGCGG 
GCGCAGGTCG AGGCGCTGCG CAAGAACTGC GCCGACTTCG GGGTCCGCCT GTTCCCGATG 
AACGACCCGG ACCAGGGCAT CGTCCACGTG GTCGGCCCGC AGCTCGGCCT GTCCGAGCCG 
GGCATGACGA TCGTCTGTGG CGACAGCCAC ACCTCGACGC ACGGCGCCTT CGGGGCGCTC 
GCCTTCGGCA TCGGCACCAG CCAGGTCGAG CATGTGCTGG CCACCCAGAC GCTGCCGCAG 
CGCCGCCCGA AGACGATGGC GGTCACCGTC CAGGGTGAGC TGCCCGCCGG GGTCACCGCG 
AAGGACCTGA TCCTCGCCGT GATCGCCCGG ATCGGCACGG GTGGCGGCGC CGGCTACGTC 
ATCGAGTACC GCGGCGAAGC CGTCCGCGGG CTGTCGATGG AGGGCCGGAT GACGGTCTGC 
AACATGTCGA TCGAGGCGGG CGCGCGCGCC GGGATGATCG CCCCGGACGA GACCACGTTC 
GAGTACCTCA GGGGACGTCC GAACGCCCCG ACCGGGGCCG ACTGGGACGC CGCGGTCGAG 
TACTGGCGCA CCCTGGCCAC CGACCCCGAC GCCACGTTCG ACCACGAGGT CGTCATCGAC 
GGGCCCAGCC TGAGCCCGTA CGTCACCTGG GGGACCAACC CGGGCCAGGC TGCGCCGCTG 
AGCTCGCCCG TGCCCGACCC GGCCGCCTAT GCCGACCCGG CCGCGCGCGG CTCGGTGGAA 
CGCGCCCTGG CCTACATGGA TCTCGTGCCG GGCACCCCGC TGTCCGACGT CGCCGTCGAC 
ACCGTCTTCA TCGGATCCTG CACCAACGGC CGGATCTCCG ACCTGCGTGA CGCCGCCGAC 
GTGCTGCGCG GGCGCCAGGT GGCGGACGGC CTTCGGGTCC TGGTCGTCCC CGGCTCGATG 
GCGGTCAAGG CCGAGGCGGA GGCGGAGGGC CTCGACGAGG TGTTCCGCGC CGCGGGCGCC 
GACTGGCGTA GCGCCGGCTG CTCGATGTGC CTGGGCATGA ACCCGGACAC CCTGCGGCCG 
GGGGAGCGCA GCGCGTCGAC GTCCAACCGC AACTTCGAGG GCCGGCAGGG CCCCGGCGGG 
CGAACCCACC TCGTCTCGCC GGCGGTCGCC GCCGCCACCG CGGTGACCGG CCGCCTCACG 
GCGCCCGCCG ACCTGTAG

Protein sequence

MGRTLAEKVW DAHVVRRADG EPDLLYIDLH LVHEVTSPQA FEALRLAGRP VRRPDLTLAT 
EDHNVPTTDT LLPIADPVSR AQVEALRKNC ADFGVRLFPM NDPDQGIVHV VGPQLGLSEP 
GMTIVCGDSH TSTHGAFGAL AFGIGTSQVE HVLATQTLPQ RRPKTMAVTV QGELPAGVTA 
KDLILAVIAR IGTGGGAGYV IEYRGEAVRG LSMEGRMTVC NMSIEAGARA GMIAPDETTF 
EYLRGRPNAP TGADWDAAVE YWRTLATDPD ATFDHEVVID GPSLSPYVTW GTNPGQAAPL 
SSPVPDPAAY ADPAARGSVE RALAYMDLVP GTPLSDVAVD TVFIGSCTNG RISDLRDAAD 
VLRGRQVADG LRVLVVPGSM AVKAEAEAEG LDEVFRAAGA DWRSAGCSMC LGMNPDTLRP 
GERSASTSNR NFEGRQGPGG RTHLVSPAVA AATAVTGRLT APADL