Gene Arth_4200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4200
Symbol
ID	4443601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008539
Strand	-
Start bp	30950
End bp	32317
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	65%
IMG OID	639687725
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_829422
Protein GI	116662369
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTATG ACCTCGTAAT CCTCGGCGGC GGCAGCGCCG GCTACGCCGC CGCGCTGCGC 
GGGGCGCAGC TGGGCATGAC GGTGGCCCTG ATTGAGGGCG ACAAGCTTGG CGGGACCTGC 
CTGCACCGTG GATGCATCCC GACCAAGGCG CTGTTGCATT CAGCAGAAGT GGCCGACACC 
ATCCGGGAGA GCGAAGCATT TGGCGTGGAG AGCGCCTTCG GCCGCGTCGA CATGGCCGGG 
GTGACAAAGT TCAAGGCGAG CGTCGTTGAC CGCCTCTATA AAGGACTCCA AGGCCTCGTT 
TCTTCCCGCA GCGTCGACCT GATCCAGGGC TGGGGTACGC TGGCCGCCGC AGACACGGTA 
GAAGTCGACG GCACCAGCTA CCGGGGCAAA AACATTGTGC TGGCCACCGG GTCCTATTCG 
AAATCCCTGC CCGGCCTGGA CATCAGCGGA CGGGTGATCA CCTCCGAACA GGCACTCGAA 
ATGGATTTCG TCCCCAAGAG CGCACTCATC CTCGGCGGCG GCGTGATCGG TGTGGAATTC 
GCCTCGGTCT GGGCTTCCTT CGGTACCGAA GTAACCATCA TCGAAGCCCT TCCGCGCCTC 
ATCGCCAACG AGGACGAATC CCTGTCCAAA GGCCTCCAGC GGGCCTTCAC GAAACGCGGC 
ATTAAGTTCC TCACCAACAC CATGTTCGCC GGTGTCTCCC AGAACGATGA CGGCGTCACC 
GTCACCACCC AGGACGACAA AACCCTGGAG GCCGAAGTAC TGCTCGTGGC CGTGGGCCGC 
GGCCCCGTGA CAGCGAAGCT AGGCTACGAG GACGCCGGCA TCCCCATGGA ACGCGGCTTC 
GTGCCCACCA ACGACCGGCT GCACACCGGT GTCGGCAACG TCTACGCCAT CGGGGACATC 
GTGCCCGGCC TTCAGCTGGC CCACCGCGGC TTCCAGCAAG GCATCTTCGT CGCCGAAGAA 
ATCGCCGGTC TGAGCCCGGC ACCCATCATC GAATCCGGCA TCCCGCGCGT GACCTACTCC 
GAGCCCCAGG CCGGCTCTGT CGGCCTCACC GAGGCCCAGG CGAAGGAACA GTTCAGTGCC 
GACGGCATCG AGACGGTCGA GTACAACCTC GGCGGGAACG CCAAAAGCCA GATGCTGCAG 
ACCGCGGGCT TCATCAAACT CATCCGCCAA AAGGAGGGCC CGATCATCGG CGTCCACATG 
CTCGGCGCCC GGGTCAGCGA GCTCATCGGC GAAGGCCAGC TCATGGTCAA CTGGGAAGCC 
TATCCCGAGG ACGTCGCCAG CCTCCTCCAC GCCCACCCCA CCCAGAACGA CGCCATCGGC 
GAAGCGGCCC TCGCCCTGGC CGGCAAGCCC CTGCACGCCC ACGGCTGA

Protein sequence

MTYDLVILGG GSAGYAAALR GAQLGMTVAL IEGDKLGGTC LHRGCIPTKA LLHSAEVADT 
IRESEAFGVE SAFGRVDMAG VTKFKASVVD RLYKGLQGLV SSRSVDLIQG WGTLAAADTV 
EVDGTSYRGK NIVLATGSYS KSLPGLDISG RVITSEQALE MDFVPKSALI LGGGVIGVEF 
ASVWASFGTE VTIIEALPRL IANEDESLSK GLQRAFTKRG IKFLTNTMFA GVSQNDDGVT 
VTTQDDKTLE AEVLLVAVGR GPVTAKLGYE DAGIPMERGF VPTNDRLHTG VGNVYAIGDI 
VPGLQLAHRG FQQGIFVAEE IAGLSPAPII ESGIPRVTYS EPQAGSVGLT EAQAKEQFSA 
DGIETVEYNL GGNAKSQMLQ TAGFIKLIRQ KEGPIIGVHM LGARVSELIG EGQLMVNWEA 
YPEDVASLLH AHPTQNDAIG EAALALAGKP LHAHG