Gene Noca_4398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4398
Symbol
ID	4596916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4650257
End bp	4651858
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	75%
IMG OID	639779008
Product	histidine ammonia-lyase
Protein accession	YP_925582
Protein GI	119718617
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCACG ACTCCCACCC GTCGGTCGGC GTCGGCGTCG GACCGGTCTC CTTCGCCGAG 
CTCCGCGCCG TGGCGCGCGA CGGCGCCCCG GTCCACCTGA CCGACGACGC ACTGGCGGCG 
ATCGCCCGGG CGCGCGCGGT GGTCGAGGAG CTGGCCGCCT CCGAGACTCC CGTGTACGGC 
GTCTCGACGG GCTTCGGCGC CCTGGCGACG CGGCACATCC CCGCCGAGAT GCGCGCCCAG 
CTGCAGCGCT CCCTGGTCCG CTCGCACGCC GCCGGCTCCG GCCCCGAGGT GGAGCGCGAG 
GTGGTCCGGG GGCTGATGCT GCTGCGGCTC TCGACGCTGG CCACCGGACA CACCGGCGTC 
CGGGTCGAGA CCGCCCGCCT GCTCGCCGGC CTGCTCGAGC ACGGCATCAC ACCTGTGGTG 
CGCGAGTACG GCTCGCTCGG CTGCTCCGGT GACCTCGCCC CGCTGGCCCA CTGCGCCCTG 
GCCTTGATCG GTGAGGGCGA GGTCCGCGAC GCGTCCGGCG CGCTGCTGCC GGCCGCCGAC 
GCGCTGGCCG CCGTCGGGCT GGAGCCGGTC GAGCTCGCCG CCAAGGAGGG CCTCGCGCTG 
ATCAACGGCA CCGACGGGAT GCTCGGCATG CTGGTGCTGG CCATCGAGGA CCTGCGGATG 
CTGCTGCGCA CCGCGGACAT CGCCGCCGCC ATGTCGGTGG AGGGCCAGCT CGGCACCGAC 
CGGGTCTTCG CCGCGGAGCT CCAGGCGATC CGGCCGCACC CGGGCCAGGC GCGCTCGGCC 
GCGAACCTCA CCGCGCTGCT CGCCGACTCA GGCGTGGTGG CGTCGCACCG CGGCCCGGAC 
TGCAACCGGG TCCAGGACGC CTACTCCCTG CGCTGCTCGC CCCAGGTGCA CGGTGCCGCC 
CGCGACACCG TCGAGCACGC GGCGACGGTC GCCACCCGCG AGCTCGCCTC GGCCGTGGAC 
AACCCGGTGG TCGTCTTCGA CGACCTGGGC GGGCGGGGGA CCGGGGGTCT GGGGGGCGGA 
GCCCCCGGGC GGGTCGAGTC GAACGGGAAC TTCCACGGGG CGCCGGTCGC CTACGTCCTC 
GACTTCCTCG CGATCGTCGC GGCCGACGTG GCCTCGATCA GCGAGCGTCG TACCGACCGG 
TTCCTCGACA AGGCGCGCAA CCACGGGCTG CCGCCGTTCC TCGCCGACGA CCCCGGGGTC 
GACAGCGGGC ACATGATCGC GCAGTACACC CAGGCCGCGA TCGTCTCCGA GCTGAAGCGG 
CTCGCCGTGC CGGCCTCGGT CGACTCGATC CCCTCCAGCG CGATGCAGGA GGACCACGTG 
TCGATGGGGT GGTCGGCCGC CCGCAAGCTG CGCCGCTCGG TCGACGGGCT GACCCGCGTC 
GTCGCGATCG AGGTGCTCAC CGCGGCCCGG GCGCTCGACC TGCGCCGACC GCTCGAGCCG 
TCGCCGGCCA CCGGTGCCGT CATCGGGCTG CTGCGCGGCG CCGGGGTCGC CGGCCCCGGA 
CCCGACCGAC ACCTCTCGCC CGAGATCGAG ACCGTGGTCG GCCTGGTCTC CTCCGGCGCC 
GTACTCCATG CTGCCGAGAC CGTGATCGGA GAACTGTCGT GA

Protein sequence

MNHDSHPSVG VGVGPVSFAE LRAVARDGAP VHLTDDALAA IARARAVVEE LAASETPVYG 
VSTGFGALAT RHIPAEMRAQ LQRSLVRSHA AGSGPEVERE VVRGLMLLRL STLATGHTGV 
RVETARLLAG LLEHGITPVV REYGSLGCSG DLAPLAHCAL ALIGEGEVRD ASGALLPAAD 
ALAAVGLEPV ELAAKEGLAL INGTDGMLGM LVLAIEDLRM LLRTADIAAA MSVEGQLGTD 
RVFAAELQAI RPHPGQARSA ANLTALLADS GVVASHRGPD CNRVQDAYSL RCSPQVHGAA 
RDTVEHAATV ATRELASAVD NPVVVFDDLG GRGTGGLGGG APGRVESNGN FHGAPVAYVL 
DFLAIVAADV ASISERRTDR FLDKARNHGL PPFLADDPGV DSGHMIAQYT QAAIVSELKR 
LAVPASVDSI PSSAMQEDHV SMGWSAARKL RRSVDGLTRV VAIEVLTAAR ALDLRRPLEP 
SPATGAVIGL LRGAGVAGPG PDRHLSPEIE TVVGLVSSGA VLHAAETVIG ELS