Gene Arth_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2087
Symbol
ID	4445391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2355646
End bp	2356656
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	63%
IMG OID	639689895
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_831567
Protein GI	116670634
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.313178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGACCC GTATTGGTAT CAACGGCTTT GGCCGCATTG GCCGCAATTA CTTCCGTGCT 
GCACTGGCAC AGGGCGCTGA CCTCGAGATC GTTGCAGTCA ACGACCTCAC CAGCCCCGAA 
GCGCTGGCCC ACCTCTTCAA GTACGACTCC GTAGGCGGCC GCCTCAAGGA GACCATCGAG 
GTCAAGGACG GCAACATCGT CGTCAACGGC AACGTCGTTA AGGTTCTCGC CGAGCGCGAC 
CCCGCGAACC TCCCCTGGGG AGAGCTGGGC GTTGACATCG TCATCGAGTC CACCGGCTTC 
TTCACCAAGG CCGCTGCCGC CAAGAAGCAC CTCGACGCCG GCGCCAAGAA GGTCCTGATC 
TCCGCCCCGG CTTCGGACGA GGACATCACC ATCGTGATGG GCGTCAACCA CGAGCTTTAC 
GACAACGCCA AGCACCACAT CATCTCCAAC GCATCCTGCA CTACCAATTG CCTCGGCCCG 
CTGGCCAAGG TCATCAACGA CGAGTTCGGC ATCGAACGCG GCCTCATGAC GACGGTCCAC 
GCGTACACGG CCGACCAGAA CCTGCAGGAC GGTCCGCACA ACGACCTCCG CCGTGCCCGC 
GCCGCCGCCA TCAACATGGT CCCCACCTCC ACCGGTGCGG CCAAGGCAAT CGGCCTGGTG 
CTTCCGGAAC TCAAGGGCAA GCTGGACGGC TACGCCATCC GCGTCCCCGT CCCCACCGGC 
TCCGCCACCG ACCTCACGGT CACCGTTTCC CGTGAGACCA CCGTTGAGGA AGTCAACGCA 
GCCCTGAAGA AGGCATCCGA GTCCGAGTCG CTCCAGGGCT TCCTGACCTA CACGGATGAG 
CCGATCGTCT CATCGGACAT CGTGGGCGAC CCGGCGTCGT CGATTTTCGA CTCCGGCCTG 
ACGAAGGTCA TCGGCAACCA GGTCAAGGTT GTTTCCTGGT ATGACAACGA ATGGGGCTAC 
TCGAACCGCC TGGTCGACCT CACGGAGCTC GTCGCATCCA AGCTGGGCTA G

Protein sequence

MTTRIGINGF GRIGRNYFRA ALAQGADLEI VAVNDLTSPE ALAHLFKYDS VGGRLKETIE 
VKDGNIVVNG NVVKVLAERD PANLPWGELG VDIVIESTGF FTKAAAAKKH LDAGAKKVLI 
SAPASDEDIT IVMGVNHELY DNAKHHIISN ASCTTNCLGP LAKVINDEFG IERGLMTTVH 
AYTADQNLQD GPHNDLRRAR AAAINMVPTS TGAAKAIGLV LPELKGKLDG YAIRVPVPTG 
SATDLTVTVS RETTVEEVNA ALKKASESES LQGFLTYTDE PIVSSDIVGD PASSIFDSGL 
TKVIGNQVKV VSWYDNEWGY SNRLVDLTEL VASKLG