Gene Arth_1470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1470
Symbol
ID	4446001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1631267
End bp	1632385
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	65%
IMG OID	639689281
Product	histidinol-phosphate aminotransferase
Protein accession	YP_830964
Protein GI	116670031
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0168842
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTGACC AGCTAGAGCG CCTGAACCGA CTTCCCCTCC GGACCAACCT GCGTGGCCTC 
ACCCCGTATG GTGCGCCGCA GCTGGACGTT CCCATCCTGC TCAATGTCAA CGAAAACACC 
CATGGCGTTC CGGCCGATGT CCTCGTGGCC ATTTCCGAGG CCGTGACCGC GGCTGCTGCG 
GGGCTGAACC GCTATCCGGA CCGTGAGTTC ACCGAACTCC GGGAGCGACT GGCCGAGTAC 
CTTGGCCACG GCCTGGGTGC GGAGAACATC TGGGCCGCCA ACGGATCCAA CGAAGTGCTG 
CAGCAGATTC TGCAGGCATT CGGCGGTCCG GGACGTACCG CACTTGGTTT CCCGCCCACG 
TACTCCATGT ATCCCCTCCT GGCGAGCGGG ACCGACACCG AATACATCGT CGGCCAGCGT 
GCGGACGACT ATGGCCTCAG TGCCGAATCC GCTGCGCAGC AGGTCCGGGA ACTGCAGCCG 
AACATCGTTT TCCTGTGTTC ACCCAACAAC CCCACCGGCA CCGGGCTGGG ACTGGATGTG 
GTGGAGGCCG TGTATGCGGC AGGCGAGGCC AGCCAGACCG TCGTGATCGT CGATGAGGCT 
TACCACGAAT TCGCGCACGA CGGCACGCCC AGCGCCCTCA CGCTTCTTCC AGGCCGTGAG 
CGGCTTATCG TCTCCCGAAC CATGAGCAAG GCATTTGCGC TGGCCGGAGC ACGCCTGGGC 
TACATGGCTG CCGCGCCCGA GGTTGCGGAT GCACTGCGGC TGGTGCGGCT GCCGTACCAC 
CTGTCCGCTA TCACCCAGGC CACTGCGCTG GCTGCCCTGA CCCACCGCGA GGCACTGATG 
GCCGACGTCG AAGACATCAA GCTGCAGCGC GACCGGATTG TCACGGAACT GACCAGAATG 
GGCCTCAAGC CTGCCGCGTC CGACTCCAAC TACGTTTTCT TTGGCGGCCT GGAGAACCCG 
CACGAGGTCT GGCAGGGGCT GCTCGACCGC GGGGTCCTGA TCCGGGACGT TGGGATCCCC 
GGGCACTTGC GCGTCACGGC AGGCACTGAG ACGGAAACCA CAGCCTTCCT GGAAGCCCTT 
GAACTGATCC TGACCGGCCA GCCCAGCGTC CCGGCCTAA

Protein sequence

MTDQLERLNR LPLRTNLRGL TPYGAPQLDV PILLNVNENT HGVPADVLVA ISEAVTAAAA 
GLNRYPDREF TELRERLAEY LGHGLGAENI WAANGSNEVL QQILQAFGGP GRTALGFPPT 
YSMYPLLASG TDTEYIVGQR ADDYGLSAES AAQQVRELQP NIVFLCSPNN PTGTGLGLDV 
VEAVYAAGEA SQTVVIVDEA YHEFAHDGTP SALTLLPGRE RLIVSRTMSK AFALAGARLG 
YMAAAPEVAD ALRLVRLPYH LSAITQATAL AALTHREALM ADVEDIKLQR DRIVTELTRM 
GLKPAASDSN YVFFGGLENP HEVWQGLLDR GVLIRDVGIP GHLRVTAGTE TETTAFLEAL 
ELILTGQPSV PA