Gene Noca_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4100
Symbol
ID	4596614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4331326
End bp	4332777
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	639778706
Product	amidohydrolase
Protein accession	YP_925284
Protein GI	119718319
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGACC AGCCGGCCGG CCCGGAGGTC GAGACCGCTG ACCTGCTCCT ACGCGGTGCC 
ACGGTCGTCA CGATGGACGC GGACCGCACG GTCTACGAGA GGGGCTACGT CGCCGTGCGC 
GGCCAGGAGA TCCTCTCGGT CGGGGCCGAC GACGGCGACG TGCCCCGCGC TCGGGAGGTC 
CGCGACCTCG ATGGACACGT GGTGTTGCCG GGGCTGGTCA ACTGCCACAC GCACCTGTCG 
AACGGCATCT CCCGAGGCCT CTTCGACGAG TTGCCCCTCG CCGACTGGGT GGAGAAGGGG 
ATGTGGCCCT CGTTGCGCGC CAACACCCGG GAGGCGACGT ACCACGGGGC GCGGGTCGCC 
CTGGCCGAGA ACCTGCTCGG CGGCGTGACG ACCACGGTCG TGGGTGAGTT CGGCGTCCCC 
GCCCGCGACA CGCTCGACGG GGTGTTGGCG GCCGTCACCG AGTCCGGTTC GCGCTCGGTC 
GTGGCCCGCA TCTCGGTGGA CTCCGCCGAC GACCACGACT CCAGTCAGGC CGTCCCCCCT 
GACGTTCGCG AGGACATCGA CGCGGCGTTG GCCGAGGTGG ACCGGCTGCG ATCCGGCTAC 
GGCTCGGACC TCCTCGAGGT GGTCCCTGAA GCCCTCGGCG TGCTTCGCTG CTCGGCGGAC 
ATGGTCACGG AGTTCGCTCG CTACGCCCGG GACCGGGGCA CCCGGATGAC GATGCACGTC 
GCGAGCTCTC CCGACGAGCG CGACGAGGCG CAGTACCGCT TCGGCAAAGG GTCCGTCGAG 
CGCCTGCACG ACCTGGGTGT CCTCGGGCCG CACCTGTTGG TCGCCCACTG CGTGTGGAAC 
GACGACCGCG AGCGTGCACT GCTCGCCGAG AGCAGGACCG GGGTCTCCCA CAATCCCGTG 
GCGAACCTGA TGTACGCCTC GGGTCTGGCA CCCCTCTCGG AGATGCTCGA AGCAGGCGTG 
CGAGTGGGAC TCGGCACCGA CGGGGCGTCC ACCAACAACG GCCAGAACAT GTGGGAGGTC 
ATGAAGACCG CCATGTTCCT GCAGAAGTCG CGCTTCGGCG CCGGGTGGGG ATCGGCCGAG 
CTCGCCCTGG AGCTGGCCAC TCTCGGTGGA GCGCGGGCCA TCGGCATGGA GGACCGCATC 
GGCTCGCTCG GAGCCGGCAA GCGTGCCGAC ATCGTGGTGG CCACGTTGAA CAAGCCGGAG 
CTGGTCCCGC ACGCCACCTG GCCGTCGAAC CTGGTCTACT CCTTCAGCCC GAGCGCGGTG 
CGGACCGTGC TGGTCGACGG GCGCGTGGTG GTCGACGACG GTCGAGTCGT CGCGTGGGAG 
CACGACGACG TCATCGCGCA CGGCAACCGG ATGGCCCTCG AGATGGACGC CCACACCGGT 
CTGGCCCGGG CCTACCGGCA GCGGAGCCGC TGGCGCTGGG TGGGCGAGCG AGGCGGTCAG 
CCGGCCTCCT GA

Protein sequence

MTDQPAGPEV ETADLLLRGA TVVTMDADRT VYERGYVAVR GQEILSVGAD DGDVPRAREV 
RDLDGHVVLP GLVNCHTHLS NGISRGLFDE LPLADWVEKG MWPSLRANTR EATYHGARVA 
LAENLLGGVT TTVVGEFGVP ARDTLDGVLA AVTESGSRSV VARISVDSAD DHDSSQAVPP 
DVREDIDAAL AEVDRLRSGY GSDLLEVVPE ALGVLRCSAD MVTEFARYAR DRGTRMTMHV 
ASSPDERDEA QYRFGKGSVE RLHDLGVLGP HLLVAHCVWN DDRERALLAE SRTGVSHNPV 
ANLMYASGLA PLSEMLEAGV RVGLGTDGAS TNNGQNMWEV MKTAMFLQKS RFGAGWGSAE 
LALELATLGG ARAIGMEDRI GSLGAGKRAD IVVATLNKPE LVPHATWPSN LVYSFSPSAV 
RTVLVDGRVV VDDGRVVAWE HDDVIAHGNR MALEMDAHTG LARAYRQRSR WRWVGERGGQ 
PAS