Gene BBta_5998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5998
Symbol	leuC
ID	5154237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	6212673
End bp	6214094
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	67%
IMG OID	640560721
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001241843
Protein GI	148257258
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.00498287
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATGGATG TAGCGCGGCG GCAGCGAACG CTGTTCGACA AGGTCTGGGA TGCACATGTG 
GTGACGCGCC GCGAGGATGG CGCGGAGCTC TTGTTCATCG ATCGCCACCT CGTGCATGAG 
GGATCCTTCC ACGCCTTCAA CAAGCTGAAG GAGAGGCGCG CGCAGGTGCG CCGGCCTGAT 
CTCACGATCG GCGTCGCCGA TCACTACGTG CCGACGCGGA CCCGCGTGCT CAGCGAGATC 
GCGCCGGAGA TCGCGGGCAT GATCCGCCAG CTCGACGACA ATTGCCGCGC CAATGATATC 
CGTCTCTTCG GCTTCGACGA TCCGCGGCAG GGCATCGTCC ATGTGATCGG GCCCGAACAG 
GGCCTCACTC TGCCTGGTCT CACGATGGTC TGCGGCGACA GTCACACCTC GACGCATGGG 
GCGTTCGGCG CGCTCGCCTT CGGCATCGGC GCTTCGGAGG TTGCGCATGT GCTGCTGACG 
CAATGCCTGT GGCAGAAGAG ACCGAAGCAG ATGCGCATCA CGATCGACGG CGCCCTTGCA 
TCAGGGATCA CCGCCAAGGA TGTCGCGCTC GCGATCATCG CCAGGATCGG CGCCGATGGC 
GCCCGCGGCC ATGCCATCGA ATATGCCGGA ACCGCCATCG ATGCGCTGTC GATGGAGGGA 
CGGCTGACGC TGTGCAATCT CGCGATCGAG AGCGGCGCGC GTTGCGGGAT GATCGCGCCC 
GACGAGACAA CCTTCGCCTA TGTGACGGGG CGGCCGTTCG CGCCCAAGGG CGATCTCCTC 
GATCGCGCCA TCGCGAATTG GCGCGAGCTC GCGACCGACG CCGAGGCCGC GTTCGATCGC 
GAGATCCGCC TCAATGGCCA GGAGATCGCG CCGACGGTCA CCTGGGGCAT CAGTCCGGAG 
GACGCGCTGC CGATCAGCGC GGCCGTGCCT GATCCCGCTA TCTTCGACGA CCCCGCGCAA 
GCGAGCCATG TGCGCGAGGC GCTCGACTAT ATGGGGCTTC AGGCCGGCCA GGCGCTCGAC 
AGCATCAAGA TCGACCGCGT CTTCATCGGC TCCTGCACCA ACAGCCGCAT CGAGGATCTG 
CGGGCGGCCG CCGCCATCCT CGCCGGCCGC ACCGCCCGGG TGCCAGGGCT GGTGTCGCCG 
GGCTCGCACC TCGTCAAGCA GCAGGCCGAG CAGGAAGGCC TCGACCAGAT CTTCCGCGGC 
GCGGGCCTCG ACTGGGTCGG CTCCGGCTGC TCGATGTGCG TCGGCATGAA TGGCGACCTC 
GTGCCGGCCG GCGAGCGCTG CGCGTCGACC ACCAACCGCA ACTTCAAGGG CCGGCAAGGT 
CAAGGCGCGC GCACGCATCT GATGTCGCCG GCGATGGTGG CGGCCGCAGC CGTGACCGGC 
CAGCTGACCG ACGTGCGGAA CTTTCTGAGG GGCGATCGAT GA

Protein sequence

MMDVARRQRT LFDKVWDAHV VTRREDGAEL LFIDRHLVHE GSFHAFNKLK ERRAQVRRPD 
LTIGVADHYV PTRTRVLSEI APEIAGMIRQ LDDNCRANDI RLFGFDDPRQ GIVHVIGPEQ 
GLTLPGLTMV CGDSHTSTHG AFGALAFGIG ASEVAHVLLT QCLWQKRPKQ MRITIDGALA 
SGITAKDVAL AIIARIGADG ARGHAIEYAG TAIDALSMEG RLTLCNLAIE SGARCGMIAP 
DETTFAYVTG RPFAPKGDLL DRAIANWREL ATDAEAAFDR EIRLNGQEIA PTVTWGISPE 
DALPISAAVP DPAIFDDPAQ ASHVREALDY MGLQAGQALD SIKIDRVFIG SCTNSRIEDL 
RAAAAILAGR TARVPGLVSP GSHLVKQQAE QEGLDQIFRG AGLDWVGSGC SMCVGMNGDL 
VPAGERCAST TNRNFKGRQG QGARTHLMSP AMVAAAAVTG QLTDVRNFLR GDR