Gene Arth_2679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2679
Symbol
ID	4444733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3003375
End bp	3004373
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	62%
IMG OID	639690499
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_832158
Protein GI	116671225
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0614199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAC TCCTTGTCAC CGGCGGTGCC GGCTTCATCG GTTCCAATTT TGTTCACTAC 
GTTCTTGAGA ACACTGATGA TCACGTCACT GTTCTGGACA AGCTGACGTA CGCAGGCAAC 
CTGGAATCCC TGAGCGGGCT CCCGGAGGAG CGCTTCCGCT TCGTGCAGGG CGATATCTGC 
GACGCCGCAC TGGTGGACAC GCTCGTGGCC GATGCCGACG TCGTGGTCCA CTACGCCGCC 
GAGTCGCACA ACGATAACTC GCTGCATGAC CCGCGGCCGT TCCTGGACAC GAACATCATC 
GGCACCTACA CGCTGATCGA GGCCGCCCGG AAGCACAACA AGCGCTTCCA CCACATCTCC 
ACCGACGAGG TCTACGGGGA CCTGGAACTC GATGACCCGG AGCGGTTCAC GGAAGAGACT 
CCGTACAACC CCTCGAGCCC GTACTCCTCC ACGAAGGCCG GCTCTGACCT GCTGGTTCGC 
GCCTGGGTCC GTTCCTTCGG GCTGCAGGCG ACCATCAGCA ACTGCTCGAA CAACTACGGC 
CCGTACCAGC ACGTGGAGAA GTTCATCCCG CGCCAGATCA CCAACGTGAT CGACGGGATC 
CGGCCCAAGC TCTACGGCAA GGGCGAGAAC GTCCGCGACT GGATCCACGC CAACGACCAC 
TCCTCGGCCG TGCTGGCCAT CATCGCCAAG GGAAAAATCG GCGAAACCTA CCTGATCGGC 
GCGGACGGCG AGAAGAACAA CAAGGACGTC GTGGAGCTCA TCCTCAAGCA CATGGGCCAG 
TCCCCGGACG CCTACGACCA CGTCGTGGAC CGCCCCGGCC ATGACCTGCG CTACGCCATC 
GACTCCACCA AGCTCCGCAA CGAGCTCGGC TGGGAACCGA AGTTCTCCAA CTTCGACGCC 
GGCATCGAGG ACACCATCGC CTGGTACCGC GAGAACGAAA ACTGGTGGCG CCCGCAGAAA 
GCCCAGACCG AAGCGAAGTA CAAGGAACAG GGCCAGTAG

Protein sequence

MQKLLVTGGA GFIGSNFVHY VLENTDDHVT VLDKLTYAGN LESLSGLPEE RFRFVQGDIC 
DAALVDTLVA DADVVVHYAA ESHNDNSLHD PRPFLDTNII GTYTLIEAAR KHNKRFHHIS 
TDEVYGDLEL DDPERFTEET PYNPSSPYSS TKAGSDLLVR AWVRSFGLQA TISNCSNNYG 
PYQHVEKFIP RQITNVIDGI RPKLYGKGEN VRDWIHANDH SSAVLAIIAK GKIGETYLIG 
ADGEKNNKDV VELILKHMGQ SPDAYDHVVD RPGHDLRYAI DSTKLRNELG WEPKFSNFDA 
GIEDTIAWYR ENENWWRPQK AQTEAKYKEQ GQ