Gene Nham_3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_3107
Symbol
ID	4029896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	-
Start bp	3427833
End bp	3428933
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	69%
IMG OID	637971522
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_578304
Protein GI	92118575
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGT TCACATTGCC CGATCTGGGC GAGGGCCTCG AGGAGGCCGA AGTCGTCGCC 
TGGCACGTCA ATGAGGGCGA CCATATTGTG ACCGATCAGC CGCTGCTGTC GGTGGAGACC 
GACAAGGCGG TGGTCGAAGT GCCGTCGCCG TGGAGCGGAC GCATCGCGCG GCTGTGCGCG 
GAGAAGGGCG ATCTGGTCAA GGTCGGCGCG CCGCTGGTGG AATTCGCCGC CGACGCCGAG 
CGGGACACCG GTACGGTGGT CGGCCAGCTT GAGAGCAGCG AGGAACGCGA CGCGAAGGCC 
CCAAAGGTCG CACCGGCGCG GCGAGGCACG GCACAGGCCG CGCCGGCGGT CCGTGCGCTC 
GCCCAAAAAC TCGATGTCGA TCTCAACGCG GTGCAGCCGA CCGGCCCCGA TAACACCATT 
ACGCGTGCGG ATGTCGAACG CGCCGCGCGC AGCCTCGCCG AGGCTGGACC GGCGCAGGTG 
CTGCGCGGAA TGCGGCGCGC GATGGCGCAG CGCATGACCG CCGCACACGC CGAAGTCGTT 
CCCGCCACCG TCACGGACGA CGCCGACATC GAGGAGTGGC GCAAGGACGA AGACGCCACG 
ATCCGCCTGA TGCGGGCTAT CGCAGCAGCG TGCAAAGCCG AACCCGCGCT CAATACATGG 
TACGATTCCC GTGCCGGCGA GCGTCGTCCG ATCACGCGCG TCGATATCGG AATCGCGATC 
GACACCGAAG GTGGCCTGAT CGTGCCGATC GTGCGCAACG TCGCCGCGCG CGATGCACAT 
GACTTGCGCG CCGGGCTCGA CCGGCTGCGC ACCGATGCGG CCGCGCGACG AATTCCGCCG 
GAGGAATTGC GCGGCGCCAC CATCACGTTG TCGAATTTCG GCATGATCGG CGGCCGCTTC 
GCGAATCTCG TTGTGGTGCC GCCGCAGGTG GCCATTGTCG GCGCCGGACG CATCGTCCAG 
CGCGTGGTGG CGCATCACGG CCAGCCGGCG GTGCGCCGCG TGCTGCCGTT GTCGCTTTCG 
TTCGACCATC GCGTGGTGAC CGGGGGCGAG GCCACGCGCT TCCTGATGGC GCTGAAGGCG 
GATATCGAGC GCTCCGCATA G

Protein sequence

MQQFTLPDLG EGLEEAEVVA WHVNEGDHIV TDQPLLSVET DKAVVEVPSP WSGRIARLCA 
EKGDLVKVGA PLVEFAADAE RDTGTVVGQL ESSEERDAKA PKVAPARRGT AQAAPAVRAL 
AQKLDVDLNA VQPTGPDNTI TRADVERAAR SLAEAGPAQV LRGMRRAMAQ RMTAAHAEVV 
PATVTDDADI EEWRKDEDAT IRLMRAIAAA CKAEPALNTW YDSRAGERRP ITRVDIGIAI 
DTEGGLIVPI VRNVAARDAH DLRAGLDRLR TDAAARRIPP EELRGATITL SNFGMIGGRF 
ANLVVVPPQV AIVGAGRIVQ RVVAHHGQPA VRRVLPLSLS FDHRVVTGGE ATRFLMALKA 
DIERSA