Gene Arth_4029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4029
Symbol
ID	4447865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4548815
End bp	4549933
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	65%
IMG OID	639691860
Product	aminotransferase
Protein accession	YP_833504
Protein GI	116672571
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCAC CAGAGAACCC CGCCGGGGGA ATCAGGCCCC GTCCGGTCGT GGACAGGCTG 
CCCCGCTATG CCGCCGGCAA GCCCCCGGCC GCCGTCGAGG GCCTTGCCAG CTACAAACTG 
TCCTCGAACG AGAACCCGCT TCCGCCCCTG CCTGCAGTGC TGCAGGCCAT CGCGGACCAG 
ACGGACTTCA ACCGCTACCC GGATCCGCTC AGCAGCAAGC TCCGGGGGGC GCTTGCGGAA 
TTCCTGCAGG TCCCTTCCGA AGACATTGTC ACCGGTGCTG GCAGCCTCGG CGCCCTGAAC 
CAGCTCCTGG TGACCTTCGC CGGGCAGAAC GACGACGGCA AAGCCGATGA AGTCATCTAC 
GCCTGGCGGT CCTTTGAGGC CTACCCCATC TGCGTCGGGC TCGCCGGGGC TGAGAGCGTG 
CGGATCCCGC TGACGCCCGA CGGCCGCCAC GATCTCGACG CCATGGCAGC AGCCGTCACC 
GCGCGCACCA AAGTCATCCT GCTGTGCACC CCCAACAACC CCACCGGGCC CATCCTTGAA 
GCCGAAGAAA CCGAACGGTT CATCCGCTCG GTCCCTTCGG ACGTGGTCAT CGTCATCGAC 
GAGGCCTACC AGGAGTTCGT TCGCGCGGAG CACGCCGTGA ACGGGATCGA GATGTACCGC 
AAGTACCCGA ACGTGGTGGT CCTGCGGACA TTCTCCAAGG CCCACGGCCT GGCCGGGCTT 
CGTGTGGGGT ACAGCGTCTC CAACCCGGAC CTTACCCAGC ACCTCCGGGT CGCCGCCACG 
CCGTTCGCCG TATCCCAGAT CGCCGAGCGC GCAGCCGTCA CGTCCCTGCA GAACTTCAGC 
CAGGTTGTAG AAAGGGTACA AAGGCTGGTG GATGAGCGTG ACCGCGTCAC GGCCGGGTTG 
CGAGAGCTCG GCTGGTTCGT GCCGGACGCC CAGGGCAACT TCGTGTGGCT CGATCTGGGC 
GAAAACAGTG CGGACTTCGC AGCACTGGCG GGAGAACGTG CCCTGTCCGT GCGGGCGTTC 
GGCAATGAAG GCGTCCGGGT GAGTATCGGC GAGGAGGAAG CGAACACCCG TTTCCTCAAA 
CTCTGTGCAG ACTATACAAA GCCGCCACGG AGTTCCTAG

Protein sequence

MTSPENPAGG IRPRPVVDRL PRYAAGKPPA AVEGLASYKL SSNENPLPPL PAVLQAIADQ 
TDFNRYPDPL SSKLRGALAE FLQVPSEDIV TGAGSLGALN QLLVTFAGQN DDGKADEVIY 
AWRSFEAYPI CVGLAGAESV RIPLTPDGRH DLDAMAAAVT ARTKVILLCT PNNPTGPILE 
AEETERFIRS VPSDVVIVID EAYQEFVRAE HAVNGIEMYR KYPNVVVLRT FSKAHGLAGL 
RVGYSVSNPD LTQHLRVAAT PFAVSQIAER AAVTSLQNFS QVVERVQRLV DERDRVTAGL 
RELGWFVPDA QGNFVWLDLG ENSADFAALA GERALSVRAF GNEGVRVSIG EEEANTRFLK 
LCADYTKPPR SS