Gene Noca_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3044
Symbol
ID	4600161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3240906
End bp	3241994
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	72%
IMG OID	639777650
Product	histidinol-phosphate aminotransferase
Protein accession	YP_924233
Protein GI	119717268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCTTCC CACCCCTGCG CGAGGAGCTG CGGGGCATCG AGCCCTACGG CGCGCCGCAG 
CTGGACGTTC CCGTCCAGCT CAACGTCAAC GAGAACCCCT ACGGGCCATC GCCGGCCTGC 
GCCGCTGACA TCGCGGCCGC GGTCGCGCTG GCCGCGGGCA CGCTGAACCG CTACCCCGAC 
CGCGAGTTCG TCGACCTGCG GATGGCACTG GCGTCGTACC TCGGCCACGG CGTCACCCAC 
GAGCAGGTGT GGGCGGCGAA CGGGTCCAAC GAGGTGATGC TCCAGCTGCT CCAGGCGTTC 
GGCGGCCCGG GCCGGGTGGC GCTGAGCTTC GCCCCGACGT ACTCCATGTA TCCCGAGTAC 
GCCCGCGACA CCGTCACCGA GTGGGTCGTC GGGCACCGCG AGTCCGACTT CGCGCTCGAT 
CTCGACCACG CGCACGACCT CGTCAAGGAG CGCCAGCCGA GCGTCGTGCT GCTCCCGAGC 
CCGAACAACC CGACCGGCAC CGCGCTGCCG CTCGACGCCG TCACCGCGCT GTGCGAGGCG 
GCGGCCGGGA ACGAGCAGCC CGGGGTCGTC GTGGTCGACG AGGCGTACGG CGAGTTCCGC 
CGGGCCGGCA CGCCCAGCGC GCTGGAGCTG CTGCCGCGGC ACCGCAACCT GGTGGTGACC 
CGCACGATGA GCAAGGCGTT CGCGCTGGCC GGTGCCCGGG TCGGCTACCT GGCGGCGGCG 
CCGGAGATCT GCGACGCGAT CCGGGTCGTG CGGCTGCCGT ACCACCTGTC CGCGGTCACC 
CAGGCGACCG CGCTCGCGGC GCTACGGCAC GCGCCGGAGC TGCTCGGCAA GGTCGACGAG 
CTGCGGGCCG AGCGCGACCG CACGGTCGAC TGGCTGCGCG AGCAGGGCCT GACGGTCGCG 
GACACGGATG CGAACTTCGC GCTGTTCGGG ACCTTCGCCG ACCGGCATGC TGTGTGGCAG 
GGGTTGCTGG GCCGGGGGGT GCTGATCCGG GAGACCGGCC CGGACGGCTG GCTGCGGGTC 
TCGATCGGCA CCGCCGAGGA GATGCAGGCA TTCAAGGACG CACTGACCCA GGTCAGGAAG 
GAAATGTGA

Protein sequence

MTFPPLREEL RGIEPYGAPQ LDVPVQLNVN ENPYGPSPAC AADIAAAVAL AAGTLNRYPD 
REFVDLRMAL ASYLGHGVTH EQVWAANGSN EVMLQLLQAF GGPGRVALSF APTYSMYPEY 
ARDTVTEWVV GHRESDFALD LDHAHDLVKE RQPSVVLLPS PNNPTGTALP LDAVTALCEA 
AAGNEQPGVV VVDEAYGEFR RAGTPSALEL LPRHRNLVVT RTMSKAFALA GARVGYLAAA 
PEICDAIRVV RLPYHLSAVT QATALAALRH APELLGKVDE LRAERDRTVD WLREQGLTVA 
DTDANFALFG TFADRHAVWQ GLLGRGVLIR ETGPDGWLRV SIGTAEEMQA FKDALTQVRK 
EM