Gene Noca_3533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3533
Symbol
ID	4595715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3743754
End bp	3744875
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	71%
IMG OID	639778141
Product	adenosine deaminase
Protein accession	YP_924720
Protein GI	119717755
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0451471
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTGT CGCCGAGCCC GTCCCCGAAC CCGTCCCCGA CCCTCGACCA GGTGCAGCGG 
GCGCCGAAGG CGCTGCTGCA CGACCACCTG GACGGCGGGC TGCGGCCCCA GTCGATCATC 
GAGCTCGCAG CGGAGATCGG GCACCAGCTG CCGGCCGTGG AGGGCGACCT GTCCGCCGAG 
TCGCTCGGCC GCTGGTTCGC GGAGGCCGCC GACTCCGGCT CGCTGGAGCG CTACCTGGAG 
ACCTTCGACC ACACGGTCTC GGTGATGCAG ACGGCCTCGG CGCTGACCCG GGTGGCGCGG 
GAGTGCGTGG AGGACCTGGT CGCCGACGGC GTGGTGTACG CCGAGGTCCG CTACGCGCCC 
GAGCAGCACG TGGTCCAGGG GCTGAGCCTC GACGAGGTCG TCGCGGCGGT CCAGGAGGGC 
TTCGACCAGG GCGTGGAGGC GGCCGGCGGG CGGATCGTCG TCCGCCAGCT GCTCACCGCG 
ATGCGGCACC AGGCTCGGTC GATGGAGATC GCCCACCTCG CGGTCGCGTG GCGCGATCGC 
GGCGTCGCCG GCTTCGACAT CGCCGGTGCC GAGGCCGGCT ATCCCCCCAC CCGCCACCTG 
GACGCGTTCG AGTACCTGCA GCGGGAGAAC GCCCACTTCA CGATCCACGC CGGCGAGGGC 
TTCGGGCTGC CGTCGATCTG GCAGGCCATC CAGTGGTGTG GCGCCGACCG GCTCGGGCAC 
GGCGTCCGGA TCATCGACGA CATCACGGTC GCCGAGGACG GGGCCGTGAG CCTCGGCCTG 
CTGGCGGCGT ACGTCCGCGA CAAGCGGATC CCGCTGGAGA TGTGCCCCTG GTCGAACGTG 
CAGACCGGCG CGGCCACCTC GATCGCCGAG CACCCGATCG GGCTGCTGAA GCGGCTCGGC 
TTCCGGGTGA CGGTGAACAC CGACAACCGG CTGATGAGCC GCACCTCCGT GACCCACGAG 
CTGTGGTCGT TGGTCGAGGC GTTCGGCTAC GGGTTGAAGG ACCTGGAGTG GTTCACGATC 
AACGCGATGA AGTCGGCGTT CCTGCCCTTC GACGAGCGGC TGGCGCTGAT CACCGATGTG 
ATCAAGCCGG AGTACGCCGT GCTCAAGGCC GAGCACGCGT GA

Protein sequence

MTVSPSPSPN PSPTLDQVQR APKALLHDHL DGGLRPQSII ELAAEIGHQL PAVEGDLSAE 
SLGRWFAEAA DSGSLERYLE TFDHTVSVMQ TASALTRVAR ECVEDLVADG VVYAEVRYAP 
EQHVVQGLSL DEVVAAVQEG FDQGVEAAGG RIVVRQLLTA MRHQARSMEI AHLAVAWRDR 
GVAGFDIAGA EAGYPPTRHL DAFEYLQREN AHFTIHAGEG FGLPSIWQAI QWCGADRLGH 
GVRIIDDITV AEDGAVSLGL LAAYVRDKRI PLEMCPWSNV QTGAATSIAE HPIGLLKRLG 
FRVTVNTDNR LMSRTSVTHE LWSLVEAFGY GLKDLEWFTI NAMKSAFLPF DERLALITDV 
IKPEYAVLKA EHA