Gene Arth_3191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3191
Symbol
ID	4444181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3595441
End bp	3596997
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	64%
IMG OID	639691017
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_832669
Protein GI	116671736
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAA CGAAAGTATT CCTGCTGCCG GACCTGGGCG AAGGCCTCAC CGAAGCCGAG 
CTTGTGAACT GGCTCGTGGC CGTGGGCGAC GAAATCCGGG TGGACCAGCC CATCGCCGAG 
GTCGAGACCG CGAAGTCCAT GGTGGAAGTC CCGTCCCCGT ACGCCGGCAC AGTTGCCGTG 
CTTCACGGAG AGCCAGGCCA GACCCTGGAC GTCGGCAAGC CGCTGATTTC GGTCGCGCCC 
ACTGGCACCT TGGTGGTCGA GCCTGTCGAG ACCAAGCCCG TCGAGACCAA GCCTGTCGAA 
ACCGCCGCCG CCGAAACTTA CCGGGAAGAG GAAAAAGCCG GCTCCGGCAA CGTCCTCATC 
GGCTACGGAA CACCCGGCGG CCACGGTGTA GCCCGCCGCA CGCGCGCGCG GAAGCAGCCG 
GTCGTCGAGC CTGTCGAGAC CGGTTCTGTC GCAACTCACA CCCCGGTAGT TGAGCCTTTC 
CGTTCGGTGG TTGAGCCTGT CGAAACCACA AGTGCGGAAA AGTCCGCCGA CGATGTCCTG 
CTCCTGCGCA CACGCGTGCC GGGAAAATTG GGGGCGGTGA TTTCGCCGCT CGTCCGCCGG 
ATGGCCCGTG ACCACGGAGT TGACCTGGGA GGACTCCAAG GATCAGGCGC AAGCGGGCTG 
ATCATGCGCA AGGACGTCGA GGCGGCCATA GCTCCCGCGC CCGAGGTAAA GCCGCCTTCG 
GTGGTTGAGC CAGTCGAAAC CCGCCGCCCC GTGGCCGCGG CGCGTTCGGT GGATGACCGA 
CGTTCGGTGG TTGAGCCTGT CGAAACCCGC CATCGTGAAA CCGACCCACG AACAGGCCTC 
GGCATCACAG CACGAACGCC GGTCCGAGGA GTCCGCAAGG CAGTGGCCGC GAACATGACG 
CGAAGCCGCT CCGAGATCCC AGAAGCCACT GTATGGGTCG ATGTGGATGC CACAGCGCTT 
GTGGAAATGC GTGCGGCGCT TAAGAAGTCC GATCCGCACA ACACCCCGGG GCTGCTGGCA 
TTCATCGCAC GGTTTGTGAC GGCGGGACTG AAGAAGTATC CGGAGCTGAA TACCAGAATT 
GTCACCACAG AGGACGCCGC AGGTGGGGAG AGCCAGGAAA TCGTCGCGTT CGACGGTATA 
AACCTGGGCT TCGCCGCGCA GACGGACCGG GGACTTATGG TGCCATCGGT GCGCAATGCG 
GGCAAGATGA GCGCCCGTGA GTTGGACGCT GAGATTCGCA GGCTCACAGC GGTCGTGCGT 
GAAGGCAAGG CGACACCTTC AGAGCTGGGA AGTGGCACCT TCACTCTGAA CAACTATGGG 
GTCTTCGGAG TGGACGGCTC AGCAGCGATC ATCAATCACC CGGAGGTTGG AATCTTGGGC 
GTAGGGCGCA TCATCGACAA GCCTTGGGTG GTCAACGGCG AGCTGGCCGT CCGCAAGGTC 
ACGGAGCTAA CACTCACCTT CGATCACCGC GTGTGCGACG GCGGAACGGC GGGCGGCTTC 
CTGCGGTACG TGGCTGATGC GATCGAGAAC CCGGGGTCCG TGCTGGCAGA TATGTAG

Protein sequence

MSETKVFLLP DLGEGLTEAE LVNWLVAVGD EIRVDQPIAE VETAKSMVEV PSPYAGTVAV 
LHGEPGQTLD VGKPLISVAP TGTLVVEPVE TKPVETKPVE TAAAETYREE EKAGSGNVLI 
GYGTPGGHGV ARRTRARKQP VVEPVETGSV ATHTPVVEPF RSVVEPVETT SAEKSADDVL 
LLRTRVPGKL GAVISPLVRR MARDHGVDLG GLQGSGASGL IMRKDVEAAI APAPEVKPPS 
VVEPVETRRP VAAARSVDDR RSVVEPVETR HRETDPRTGL GITARTPVRG VRKAVAANMT 
RSRSEIPEAT VWVDVDATAL VEMRAALKKS DPHNTPGLLA FIARFVTAGL KKYPELNTRI 
VTTEDAAGGE SQEIVAFDGI NLGFAAQTDR GLMVPSVRNA GKMSARELDA EIRRLTAVVR 
EGKATPSELG SGTFTLNNYG VFGVDGSAAI INHPEVGILG VGRIIDKPWV VNGELAVRKV 
TELTLTFDHR VCDGGTAGGF LRYVADAIEN PGSVLADM