Gene Francci3_3621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3621
Symbol
ID	3904175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4323575
End bp	4324972
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	72%
IMG OID	637880942
Product	isopropylmalate isomerase large subunit
Protein accession	YP_482702
Protein GI	86742302
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.766514
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCGCA CACTTGCGGA AAAGGTCTGG GACGCCCACG TGGTGCGGCG CGCCGACGGT 
GAACCGGATC TGCTGTACAT CGATCTGCAC CTGGTTCACG AGGTCACCTC GCCGCAGGCG 
TTCGAGGCCC TGCGGCTGGC CGGGCGGCCC GTGCGGCGTC CGGAGCTGAC CCTCGCTACC 
GAGGATCACA ACGTCCCCAC CACCGACACG CTGGCGCCGA TCGCCGATCC GATCTCGGCG 
GCCCAGGTGG AGGCGCTGCG GAAGAACTGC GCCGAGTTCG GCGTGCGGCT GTACCCGATG 
AACGACCCGG GCCAGGGCAT CGTGCACGTC GTCGGCCCCC AGCTCGGGCT GTCCCAGCCC 
GGCATGACGA TCGTCTGCGG TGACAGCCAC ACCTCCACCC ATGGCGCGTT CGGGGCGCTG 
GCCTTCGGGA TCGGCACCAG CCAGGTCGAG CACGTCCTCG CGACCCAGAC GCTGCCGCAG 
CGCAGGCCGA AGACGATGGC GATCACCGTG GCGGGCGACC TGCCCGTCGG GGTCAGCGCG 
AAGGATCTCA TCCTGGCGAT CATTGCGCGG ATCGGTACCG GCGGTGGTGC CGGCCACGTC 
ATCGAGTACC GCGGTGCGGC GATCCGGGCC CTGTCGATGG AGGGCCGGAT GACGGTCTGC 
AACATGTCCA TCGAGGCCGG CGCGCGCGCC GGGATGATTG CGCCCGACGA CGTCACGTTC 
GAGTATCTCG CCGGGCGGCC GCGTGTCGCC ACCGGTGCTG CCTGGGAGGA AGCGGTGGCC 
TACTGGCGCA CCCTCGCCTC CGACTCCGAC GCGGTCTTCG ACCGGGAGGT CGTGATCGAT 
GCCGCGAGCC TCACGCCCTA CGTCACCTGG GGAACCAACC CGGGCCAGGC CGCACCGCTC 
GGATCGCTGG TTCCCGCGCC CGCCGACTAC CCGGACGCGG CCGCGCGGGC CTCGGTCGAA 
CGAGCGCTGA CCTACATGGG CCTCACCCCC GGCACCCCGT TGTCCGACGT CACCGTCGAC 
ACGGTGTTCA TCGGATCGTG CACCAACGGG CGCCTGAGTG ACCTGCGCGC CGCCGCCGAC 
GTGCTGCGCG GCCGGCGGGT GAGCGAGGGG GTCCGGGTCC TGATCGTTCC CGGCTCCATG 
GCGGTGAAGG CGCAGGCCGA GGCGGAGGGG CTCGACGAGG TCTTCCGAGC GGCGGGAGCG 
CAGTGGCGCA GCGCCGGCTG TTCGATGTGC CTCGGCATGA ACCCCGACAC GCTTCGGCCC 
GGCGAGCGCA GTGCCTCGAC GTCGAACCGC AACTTCGAGG GCCGGCAGGG GCCGGGTGGG 
CGCACCCATC TCGTCTCGCC CGCGGTCGCC GCGGCCACCG CCGTGACCGG TCGGCTGACC 
GCTCCGGCGG ATCTGTAG

Protein sequence

MGRTLAEKVW DAHVVRRADG EPDLLYIDLH LVHEVTSPQA FEALRLAGRP VRRPELTLAT 
EDHNVPTTDT LAPIADPISA AQVEALRKNC AEFGVRLYPM NDPGQGIVHV VGPQLGLSQP 
GMTIVCGDSH TSTHGAFGAL AFGIGTSQVE HVLATQTLPQ RRPKTMAITV AGDLPVGVSA 
KDLILAIIAR IGTGGGAGHV IEYRGAAIRA LSMEGRMTVC NMSIEAGARA GMIAPDDVTF 
EYLAGRPRVA TGAAWEEAVA YWRTLASDSD AVFDREVVID AASLTPYVTW GTNPGQAAPL 
GSLVPAPADY PDAAARASVE RALTYMGLTP GTPLSDVTVD TVFIGSCTNG RLSDLRAAAD 
VLRGRRVSEG VRVLIVPGSM AVKAQAEAEG LDEVFRAAGA QWRSAGCSMC LGMNPDTLRP 
GERSASTSNR NFEGRQGPGG RTHLVSPAVA AATAVTGRLT APADL