Gene Noca_4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4034
Symbol
ID	4596548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4257727
End bp	4259094
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	66%
IMG OID	639778640
Product	ethanolamine ammonia-lyase heavy chain
Protein accession	YP_925218
Protein GI	119718253
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.680075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCTAG CCGCAACGCT GTTCGGCACC CGCTACCAGT TCCGCGACAT CAAGGACCTG 
CTGGCCAAGG CCAACGAGGA GAAGTCGGGT GACCGGCTCG CCGGCGTCGC CGCCGACAGT 
GCGGCGGAGC GGATGGCGGC CAGGTTCGTC CTCAGCGAGG TCACCCTGGA GACCCTGCGC 
GCCAACCCGG CCGTCCCGTA CGAGGAGGAC GAGGTCACGC GGGTGATCGA CGACGGCGTG 
AACGAAGCGG TCTACGCGGA GATCAAGGGC ATGCAGGTCG GTGAGCTGCG CGAGTGGCTG 
CTGGCCGATA CGACCACCGG CGAGATGATC CGCCGGCTCA GCAACGGACT GACCGCCGAG 
ATGGTCGCCG CGGTCACCAA GCTGATGTCG AACCTGGACC TGATGCTGGC GGCCAGCAAG 
ATCAAGATCG TCAAGCACGC CAACAACACC ATCGGTCTGC GCGGCACGCT CGCGTCGCGC 
TGCCAGCCCA ACAACCAGAC CGACTCCGTC GAGGGCATCC GAGCCGCCGT CTACGAGGGT 
CTCAGCTTCG GTTCGGGCGA CAGCGTGATC GGCATCAACC CCTCCGACGA CTCGCTCGGG 
AGCGTCTCCC GGCTGTTGGA GATGACCCAC GAGGTCATCA CCCGATGGGA GATCCCCACG 
CAGAACTGCG TGCTCGCCCA TGTGTCCACC CAGATGGAGG CGATGCGTCA CGGCGCACCG 
GTCGGCCTGG TCTTCCAGAG CCTCGCGGGC TCGCAGAAGG GCAACGAGTC GTTCGGCATC 
GACGTGGGGA TGCTCGACGA GGCCTACGCC CTGGCCAAGC GGTACTCGGT CGCCACCGGC 
CCGAACTACA TGTACTTCGA GACGGGTCAG GGATCGGAGC TGTCCGCGGA CGCTCACCAC 
GGTGCCGACC AGGTTGTCAT GGAAGCCCGC TGCTACGGGC TGGCCAAGCG CTACGACCCC 
TTCCAGCTCA ACACGGTGGT CGGCTTCATC GGCCCGGAGT ACCTCTACGA CTCGACCCAG 
ATCACCCGGG CCGGCCTCGA GGACCACTTC ATGGGCAAGC TCACCGGCAT CTCCATGGGC 
GCCGACGTCT GCTACACGAA CCACGCTCGG TCCACCCAGA ACGAGCTGGA GAACCTGGCC 
GTGCTGCTCG GGGCTGCCGG CGTCAACTTC ATCATGGGCA TCCCGATGGG TGACGACTCC 
ATGCTGAGCT ACCAGAGCTC CAGCTTCCAC GACGCGCCCA GCCTCCGGCA GCTGCTGGGA 
CTGCGCCCAC TGCCGGAGTT CGAGGCCTGG ATGGAAGGCC TCGGGTTGCT GCGCGATGGC 
CGACTGACCG AGAAGGCAGG CGACGCCTCC TTCTTCTTGA GCAGGTAG

Protein sequence

MQLAATLFGT RYQFRDIKDL LAKANEEKSG DRLAGVAADS AAERMAARFV LSEVTLETLR 
ANPAVPYEED EVTRVIDDGV NEAVYAEIKG MQVGELREWL LADTTTGEMI RRLSNGLTAE 
MVAAVTKLMS NLDLMLAASK IKIVKHANNT IGLRGTLASR CQPNNQTDSV EGIRAAVYEG 
LSFGSGDSVI GINPSDDSLG SVSRLLEMTH EVITRWEIPT QNCVLAHVST QMEAMRHGAP 
VGLVFQSLAG SQKGNESFGI DVGMLDEAYA LAKRYSVATG PNYMYFETGQ GSELSADAHH 
GADQVVMEAR CYGLAKRYDP FQLNTVVGFI GPEYLYDSTQ ITRAGLEDHF MGKLTGISMG 
ADVCYTNHAR STQNELENLA VLLGAAGVNF IMGIPMGDDS MLSYQSSSFH DAPSLRQLLG 
LRPLPEFEAW MEGLGLLRDG RLTEKAGDAS FFLSR