Gene Arth_1688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1688
Symbol
ID	4445794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1879993
End bp	1881324
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	67%
IMG OID	639689509
Product	tryptophan synthase subunit beta
Protein accession	YP_831182
Protein GI	116670249
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.998465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGACG CGCCAACAAC CGGCTCTGAT GAGGGCACCG CGGACGCATT TCTGCAAGGA 
GACCGGTCCC TGCGCCACGC GCCGGGTCCG TACTTCGGCT CCTACGGCGG GCGCTGGATG 
CCCGAATCCC TTATCGCGGC CCTGGATGAG CTGGAAGACA CTTTCGAAAA GGCCAAGGCC 
GACCCGGAAT TCGTCGCCCA GATCAAGGAC CTGAACAAGA ACTACTCCGG CCGTCCGTCC 
CTGCTGACCG AGGCCAAGCG CTTCGCGGAG CACGCCGGGG GAGTCCGCAT CTTCCTCAAA 
CGCGAGGACC TGAACCACAC CGGTTCGCAC AAGATCAACA ACGTCCTGGG CCAGGCCCTG 
CTGGCCAAGC GCATGGGCAA GACCCGCGTG ATCGCCGAGA CCGGTGCGGG CCAGCACGGC 
GTAGCCAGCG CAACGGCCGC CGCCCTGCTG GGCCTCGAGT GTGTGGTGTA CATGGGCGCC 
GAGGACTGCC GGCGCCAGGC CCTGAACGTG GCCCGCATGG AGCTCCTGGG CGCCACGGTC 
ATTCCGGTGA CCAGCGGATC GCAGACGCTC AAGGACGCCA TCAACGAGGC GCTCCGCGAC 
TGGGTGGCGA ACGTGGACCA CACCCACTAC CTGCTCGGCA CGGCCGCCGG TGCCCACCCG 
TTCCCGGCGA TGGTGCGGTA CTTCCACGAG GTCATCGGTG AAGAAGCCCG CGCCCAGATC 
CTGGAACAGG CCGGCAGGCT GCCGGACGCC GTCTGTGCCT GCATCGGCGG CGGCTCCAAC 
GCGATCGGCA TCTTCCATGG CTTCCTGGAC GATCCTTCCG TGCGGATTTA CGGCTTCGAG 
GCCGGCGGCG ACGGCGTGGA AACCGGCCGG CACGCCGCCA CCATCAGCCT GGGCAAGCCG 
GGTGTGCTCC ACGGTGCGCG CTCGTACCTG ATGCAGGACG ACGACGGGCA GACCATCGAG 
TCGCACTCCA TCTCCGCGGG CCTGGACTAT CCCGGCGTCG GCCCGGAGCA TGCCTACCTT 
TCGGACATCG GCCGCGTCAG CTACGAACCC ATCACGGATG CCGAAGCCAT GGATGCCTTC 
CGGGTCCTGT GCCGGACCGA GGGCATCATT CCGGCCATCG AATCGGCACA TGCCCTGGCG 
GGAGCCATCA AGGTGGGGCA GCGCCTCGCC GCCGAAGCTG CAGCCGAAGG CCAGCCCGCG 
GACAGCAAGA TCGTGATCGT TAACCTCTCC GGCCGCGGGG ACAAGGACGT GGCCACGGCC 
GCCGAATGGT TCGACCTGCT GGACAAGGAT TCCGTTGAGG CCGAGATCGG CAAAGAAGGG 
GAACAGCTGT GA

Protein sequence

MVDAPTTGSD EGTADAFLQG DRSLRHAPGP YFGSYGGRWM PESLIAALDE LEDTFEKAKA 
DPEFVAQIKD LNKNYSGRPS LLTEAKRFAE HAGGVRIFLK REDLNHTGSH KINNVLGQAL 
LAKRMGKTRV IAETGAGQHG VASATAAALL GLECVVYMGA EDCRRQALNV ARMELLGATV 
IPVTSGSQTL KDAINEALRD WVANVDHTHY LLGTAAGAHP FPAMVRYFHE VIGEEARAQI 
LEQAGRLPDA VCACIGGGSN AIGIFHGFLD DPSVRIYGFE AGGDGVETGR HAATISLGKP 
GVLHGARSYL MQDDDGQTIE SHSISAGLDY PGVGPEHAYL SDIGRVSYEP ITDAEAMDAF 
RVLCRTEGII PAIESAHALA GAIKVGQRLA AEAAAEGQPA DSKIVIVNLS GRGDKDVATA 
AEWFDLLDKD SVEAEIGKEG EQL