Gene Achl_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3100
Symbol
ID	7294580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3443140
End bp	3444243
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	70%
IMG OID	643591510
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002489150
Protein GI	220913841
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG CAACAGCCGC AGCAGCACAA TCCACCTCGA ACCTGCGCGT CAGCGAATTC 
ACCCCGCTGC CCACCCCTTC CGAACTGATC GCGGACCTGC CCCTCGACGC ACAGGCCGCT 
GCCGTCGTCG AACGCGGCCG CGATGAAGTC CGCGCCATCA TGGACGGCGT GGACGACCGC 
CTGCTGGTGA TCGTGGGACC GTGCTCCATC CACGATCCCA AGGCCGGGCT GGAATACGCC 
CGCCGGCTGG TCAGCCAGGC TGAGAAGCAC AAGGAAGACC TGCTGATCGT CATGCGGACC 
TACTTCGAGA AGCCCCGCAC CACCGTTGGC TGGAAGGGCC TGATCAACGA TCCGCGGCTG 
GACGGCAGCC ACGACATGGT CACCGGCCTG CGGACCGCAC GCCACTTCCT CCAGCAGGTC 
ACCGCCCTGG GACTGCCGAC GGCCACCGAG TTCCTCGAAC CGATCAGCCC GCAGTACATG 
GCGGACCTCA TCTCCTGGGG CGCCATCGGG GCCCGCACCA CGGAGAGCCA GATCCACCGC 
CAGCTGGCAT CCGGCCTGTC CATGCCCATC GGCTTCAAGA ACGGGACCGA CGGCGGCCTG 
CAGGTTGCCA TCGACGCCTG CGGTGCCGCC GCGGCAGCCC AGGCGTTCCT GGGGATCGAC 
GGCGACGGCC GGGCCGCGCT GGTGGCCACC GCCGGCAACC CGGACACGCA CGTCATCCTC 
CGCGGCGGGC GCAAGGGGCC CAACTACTCC ACGGCAGACG TCGAAGCGGC CTCCGCCACC 
CTGGCCGGCA AGGGGCTGAA CCCGCGCCTG ATCGTGGACG CCAGCCACGC CAACAGCGGC 
AAGAGCCACC ACCGGCAGGC GGAAGTGGCC CTGGAAATCG GTGCACAGCT TGAAGAAGGC 
GGCCCGGCCG CCCAGGCGAT CGCCGGCGTC ATGCTGGAAA GCTTCCTGGT GGGAGGCGCC 
CAGAACCTGG ACGTCGTGGA GCACGCGGCC GGCCGGGATG AGCTGGTCTA CGGGCAGAGC 
GTCACGGATG CGTGCATGGA GTGGGACGTC TCGGCGTCGG TCCTGGAGCA GCTGGCCGCC 
TCAGCCCGGA AGCGCCGCGG CTGA

Protein sequence

MSTATAAAAQ STSNLRVSEF TPLPTPSELI ADLPLDAQAA AVVERGRDEV RAIMDGVDDR 
LLVIVGPCSI HDPKAGLEYA RRLVSQAEKH KEDLLIVMRT YFEKPRTTVG WKGLINDPRL 
DGSHDMVTGL RTARHFLQQV TALGLPTATE FLEPISPQYM ADLISWGAIG ARTTESQIHR 
QLASGLSMPI GFKNGTDGGL QVAIDACGAA AAAQAFLGID GDGRAALVAT AGNPDTHVIL 
RGGRKGPNYS TADVEAASAT LAGKGLNPRL IVDASHANSG KSHHRQAEVA LEIGAQLEEG 
GPAAQAIAGV MLESFLVGGA QNLDVVEHAA GRDELVYGQS VTDACMEWDV SASVLEQLAA 
SARKRRG